대럴 허프 지음/더불어책 펴냄
이번 17대 총선은 물론 선거 때마다 투표자를 상대로 한 출구조사 통계수치가 후보자들과 대중의 촉각을 곤두세우게 만든다.
어떨 때엔 이 통계수치가 실제 개표결과와 들어맞기도 하지만 전혀 다른 결과가 나오는 경우도 적지 않다.
후보자의 지지율, 당선자 예측 등 선거를 전후로 발표되는 통계수치를 우리는 어떻게 받아들여야 할까. 뿐만 아니라 경제성장률, 실업률 등 날마다 언론을 통해 쏟아지는 수많은 통계수치들을 어디까지 믿어야 하나.
'새빨간 거짓말, 통계'는 통계치에 의한 사실의 왜곡 가능성과 그 실례, 통계의 함정을 피하는 방법 등을 알려주고 있다.
미국에서 자유기고가로 활약했던 대럴 허프(1913~2001)는 조사 방법과 해석에 따라 얼마든지 사실과 동떨어진 통계 결과가 나올 수 있다고 지적하고 있다.
책을 읽다보면 "거짓말에는 세 가지 종류가 있다.
그럴듯한 거짓말, 새빨간 거짓말, 그리고 통계"라는 벤저민 디스레일의 말에 고개를 끄덕이게 된다.
미국의 '리터러리 다이제스트'지는 1936년 대통령 선거를 정반대로 예측했다.
잡지 편집진은 구독자 가운데 전화를 소유한 유권자 1천만 명을 대상으로 한 여론조사를 바탕으로 공화당 랜던 후보와 민주당 루스벨트 후보의 표가 370대 161이 될 것이라고 발표했다.
그러나 실제 결과는 199대 332로 루스벨트 후보의 승리였다.
이렇듯 왜곡된 통계가 나온 것은 부적절한 표본 탓이었다.
당시 전화를 소유하거나 잡지를 구독할 만큼 부유한 사람들, 즉 경제적 특수층이 공화당을 더 선호했기 때문이다.
조사 대상과 조사자의 관계에 따라 다른 결과가 나올 수도 있다.
제2차 세계대전 중 미국의 국립여론조사기관은 미국 남부의 흑인 500명을 대상으로 인터뷰를 했다.
조사단은 백인들로만 이뤄진 집단과 흑인들로만 이뤄진 집단으로 구성됐다.
두 조사단은 '만약 일본군이 미국을 점령한다면 흑인에 대한 차별은 지금보다 더 하겠는가 덜 하겠는가'라는 설문에 대해 각기 다른 결과를 가져왔다.
차별이 더 심해질 것이라고 응답한 수가 흑인 조사단인 경우 25%인데 반해 백인 조사단은 45%로 나타난 것. 저자는 피면접자가 면접자의 호감을 사는 응답을 하려는 경향이 있기 때문에 이러한 차이가 났다고 봤다.
흑인 응답자는 솔직한 감정보다는 백인 조사자의 마음에 들만한 응답을 많이 한 셈이다.
또한 똑같은 사실도 발표자의 의도나 관점에 따라 조작될 수 있다.
'오늘날 전기 이용이 가능한 미국 농가는 전체 농가의 4분의 3 이상입니다'. 1948년 미국의 전기회사들이 합동으로 게재한 이 신문광고는 '오늘날 전기 이용이 불가능한 미국 농가는 전체의 4분의 1이나 됩니다'라는 문구로 바꿀 수 있다는 게 저자의 얘기다.
더욱이 '이용가능(available)'이란 애매한 표현은 실제 전기를 사용하는 농가외에 그럴 개연성이 있는 농가까지 포함하고 있다는 것이다.
저자는 갖가지 사례를 통해 평균치와 지수(index), 숫자의 생략, 그래픽에 숨어 있는 통계의 함정을 밝히면서 통계의 옥석구별법을 제시하고 있다.
바로 통계의 정확한 출처 확인, 조사 방법에 대한 주의, 빠진 데이터는 없는지 숨겨진 자료 찾기, 쟁점 바꿔치기 경계, 상식적으로 말이 되는 이야기인지 살펴보기 등이다.
사족-1954년 출판된 이 책이 재판에 재판을 거듭하는 스테디셀러로 자리잡고 있다는 것은 우리가 아직도 통계의 '함정'에서 헤어나지 못하고 있다는 방증이 아닐지….
이대현기자 sky@imaeil.com
댓글 많은 뉴스
나경원 "李 장남 결혼, 비공개라며 계좌는 왜?…위선·기만"
이 대통령 지지율 58.6%…부정 평가 34.2%
[단독] 김민석 子위해 법 발의한 강득구, 金 청문회 간사하려다 불발
李대통령, 대북전단 살포 예방·사후처벌 대책 지시
李대통령, 취임 후 첫 출국…G7 정상들과 양자회담 주목