나심 니콜라스 탈렙 지음
이건 옮김
중앙북스
p.158-159
통계학은 초보자에게는 복잡해 보일지 모르지만, 사실 오늘날 사용되는 개념은 아주 단순하다. 내 친구 프랑스 수학자들은 통계학을 '요리'라고 부른다. 개념이 단순해서, 정보를 더 많이 알수록 결과를 더 확신할 수 있다는 뜻이다. 그러나 문제는 얼마나 더 확신할 수 있느냐이다. 일반 통계 기법은 신뢰 수준을 꾸준히 증대시키고 있지만, 신뢰 수준이 관측지 증가에 비례해서 높아지는 것은 아니다. 즉 표본 규모가 n배 증가하면 지식은 n의 제곱근만큼 증가한다. 빨간 공과 검은 공이 담긴 항아리에서 공을 꺼낸다고 가정하자. 공을 20회 꺼낸 뒤 빨간 공과 검은 공의 비율에 대한 신뢰 수준은, 공을 10회 꺼낸 뒤 신뢰 수준에 비해 두 배로 높아지지 않는다. 단지 2의 제곱근(1.41) 배수만큼 증가할 뿐이다.
특히 항아리 예처럼 분포가 대칭이 아닐 때 통계학은 복잡하고 이해하기 어려워진다. 항아리 속에 검은 공이 압도적으로 많아서 빨간 공을 찾을 확률이 낮은 경우에는, 꺼내는 횟수가 증가해도 빨간 공이 드믈다는 지식이 증가하는 속도는 매우 느려진다. 반면, 일단 빨간 공 하나가 발견되면, 빨간 공이 존재한다는 지식이 극적으로 증가하게 된다. 이러한 지식의 비대칭은 결코 사소한 문제가 아니라. 바로 이것이 이 책의 중심 주제이다. 또한 흄이나 칼 포퍼와 같은 사람들의 핵심적인 철학 과제이기도 하다.
댓글 영역