이전 연구에서 담배를 피우는 대학생들의 성적이 비흡연 학생보다 낮다는 조사 통계를 가지고, “흡연이 학생의 성적을 떨어뜨린다”고 말한다. 좋은 성적을 받으려면 담배부터 끊어야 한다.
우리는 A 다음에 B가 일어나면 별다른 의심 없이 A가 B의 원인이라 쉽게 생각한다.
이 예의 문제는, 낮은 성적의 학생이 흡연하는 경우가 많다는 사실을 확대해, 흡연이 성적 저하의 원인이라는 추측이 성급하다는 점이다.
혹시 낮은 성적이 학생들에게 흡연을 유도하는 것은 아닐까? 외향적인 친구와 노느라 공부에 집중하지 못하고 성적이 떨어지자, 담배를 더 피우게 됐을 수도 있다. 그럼 친구를 멀리해야 한다.
요점은 여러 요인들이 관계되어 있다면, 하나를 꼭 집어 원인이라 하기 어렵다. 인과오류를 범하지 않기 위해선 세심한 검토가 필요하다.
상관관계(correlation)의 여러가지 유형에는:
> 우연에 의한 상관관계…
다시 시도해 보면 다른 결과가 나온다.
> 원인과 결과가 서로 계속 바뀌는 역인과성(reverse causation)…
주식이 많아서 부자일 수도 있고, 부자여서 주식이 많을 수도 있다.
> 제3의 변수(confounding variable)…
가장 오류를 피하기 어렵다. 흡연자와 낮은 성적과 같은 예다.
동네 목사의 월급과 하바나의 럼주(rum) 가격의 연관성(?).
6월의 자살 증가가 겨울에 버림받은 연인이 많아서인가? 겨울 우울증에 시달린 사람들이 더 이상 버티지 못해서인가?
> 비선형적 상관관계…
강수량에 비례해 옥수수의 수확이 늘지만 일정량이 넘으면 외려 줄어든다.
상관관계를 생각할 때 일대일 또는 선형적으로, 도 아니면 모로 생각하는 경향이 있다.

상관관계는 대부분 이상적인 일대일 대응이 아니라 변수가 늘 존재하기 때문에 지나치게 일반화 하는 오류를 범하지 말아야 한다.
대학에 진학하는 것과 장래의 수입이 양의 상관관계가 있다고 해도, 주위에 대학에 안 갔어도 부자인 경우는 넘친다. 대학을 소개하는 브로셔에 돈다발 그림을 그려 ‘시각적 왜곡’(6장에서 본)까지 하며 신입생을 모집하지만, 4년간의 학비와 시간을 학교가 아닌 기회에 투자해 일찍 성공하는 경우도 있다.
'틸 펠로우십(Thiel Fellowship)'은 매년 20명을 선발해 대학을 가는 대신 2년간 10만불과 함께 실리콘밸리의 멘토들과 연결 시켜준다. 과거 산업혁명 시대에 100년의 변화를 10년에 경험하는 급변하는 시대에 대학에서의 4년은 너무 길다는 주장이다. 아이디어와 능력이 있는 젊은이들에게 빠른 창업의 기회를 주기 위해 만들었고, 대표적으로 암호화폐 이더리움(Ethereum)을 개발한 부테린(Vitalik Buterin)이 성공 사례이다.

음의 상관 관계는 어떤 원인이 늘어나면 결과가 줄어드는 반대의 경향을 띄는 상관관계를 표시하며 별이 멀리 있을 수록 어두운 것과 같다.
대학을 졸업한 중년 남성의 기혼율은 93%로 일반적인 83%보다 높은 반면, 중년 여성 기혼율은 65%로 낮다고 코넬 대학에서 발표하였다. 이 결과를 가지고 교육정도와 결혼에 음의 상관관계가 있다고 결론 내린 사람들은, 다른 중요한 요인들은 배제하고 세계 인구 감소의 해결 방안으로 여성의 교육을 줄여야 한다는 엉뚱한 주장을 하기도 한다.

우유를 많이 마시는 미국인이 우유를 거의 마시지 않는 일본 여성에 비해 특정 암에 걸리는 비율이 높다고 해서 우유와 암의 직접적인 상관관계가 있다고 결론 내리는 것은 성급하다. 여러 다른 요인이 있을 수 있지만, 당시만 해도 일본 여성의 수명이 짧아 전반적으로 암으로 인한 사망보다 다른 이유로 사망하는 경우가 많았다.
상관관계가 어떤 시기나 세대의 제한된 경향이 아닌지 확인해 보아야 하는 것을 보여주는 예이다.
병에 걸려 열이 나는 환자의 몸에 이(lice)가 견딜수 없어 도망가고, 건강한 사람에게만 이(lice)가 있다고 해서 이(lice)가 사람을 건강하게 만든다는 식의 결론을 내는 경우는 없겠지만 유사한 오류는 쉽게 만들어 진다.
미국의 한 여론 조사에서 가임 기간의 여성이 공화당 대통령 후보인 롬니(Mitt Romney)를 지지할 확률이 40.4% 가임 기간이 아닌 경우 23.4%라는 결과를 보도했다. 228명의 작은 표본 조사의 결과로, 실제 유의한 결과 인지 확인 하는 p-value test를 통과 했더라도 신뢰할 만한 결과 인지는 의문이 든다. 이 경우와 같이 표본이 작은 경우 결과의 차이가 너무 크다면 결과에 대해 의심하고 추가적인 검증을 거쳐야 한다.

AI가 발전하며 빅 데이터가 이제 일상이 되었다. 하지만 사용하는 데이터가 커지면 무조건 좋은가에 대해선 엘렌버그의 다음 이야기를 들어봐야 겠다.
2009년 UCSB 신경과학자 베넷(Craig Bennett)은 ‘죽은 연어에서 확인한 종간 신경상관관계’라는 논문을 학회에 발표했다. 제목만큼이나 실험도 이해하기 어려운데, 말이 안되는 실험이긴 하지만… 죽은 물고기를 ‘기능적 자기공명영상(fMRI)’ 장비에 넣고 물고기의 뇌 영상을 찍으면서 사람의 사진을 보여주었다 (죽은 물고기에게 어떻게 보여주었을까?).
찍은 뇌의 영상은 voxel이라는 수만 개의 작은 픽셀 이미지로, 각 픽셀은 전기 신호이니 당연히 ‘잡음(noise)’이 있다. 베넷이 이 잡음만 따로 분석한 결과, 영상을 찍을때 보여준 사진과 잡음 사이에 통계적으로 유의한 (통계적 검정인 p-value 기준을 만족하는) 상관 관계가 있는 것처럼 보이는 결과를 끌어낼 수 있었다는 것이 이 논문의 요점이다.
방대한 데이터를 분석하는 경우 ‘잡음(noise)’만으로도 잘못된 결과를 도출할 수 있다는 경고이다.
통계에서 사용하는 p-value 검정의 기준 0.005의 의미는 귀무가설(A와 B의 차이가 없다)이 참이라고 가정할 때, 현재 관측된 것과 같거나 그보다 더 큰 차이가 우연히 나타날 확률이 약 0.5% 정도는 있다는 뜻이다.

'같이 보고 싶은 책 찾기 > How to Lie with Statistics (통계로 거짖말 하기)' 카테고리의 다른 글
| 7장, 애매한 연관성 (The semi-attached Figure) (0) | 2026.03.01 |
|---|---|
| 6장, 일차원그림(The one-Dimensional picture) - 시각적 왜곡 (0) | 2026.02.18 |
| 5장, 사실을 왜곡하는 그래프 (The Gee-Whiz Graph) (0) | 2026.02.08 |
| 4장, 별거아닌 소동 - 신뢰 범위와 백분율(%)의 함정 (0) | 2026.02.01 |
| 3장, 잊혀진 소수 (The Little Figures That Are Not There) [2 / 2] (4) | 2025.10.27 |