통계를 읽는 자가 이긴다
현대 사회에서 이제 통계는 필수이다. 앞으로 통계를 이해하고 활용하는 능력이 성공과 실패를 좌우하게 된다 해도 과언이 아니다. 그 이유는 무엇일까?
사회 구성원들 간의 경쟁이 점점 치열해지고 있다. 민주주의의 발전과 함께 합리적인 행정, 자유로운 경쟁이 사회의 대세가 됨에 따라 각 경제 주체들은 예전보다 훨씬 빠르고 합리적이고 효과적인 의사결정을 필요로 하게 되었다. 통계를 적절히 활용하여 먼저 행동하는 사람이 이득을 보는 무한 경쟁 사회가 된 것이다. 통계에 밝은 사람이 이긴다.
또, IT기술의 발전이 통계의 중요성을 부각시켰다. 가장 쉬운 예가 인터넷이다. 가만히 앉아 천리를 가고 만리를 내다볼 수 있는 것이 인터넷이니, 자료를 얻기 위한 노력이 예전의 수십 분의 일로 줄었다. 거의 모든 회사에 IT시스템이 구축되어 있고, 개개인이 얻을 수 있는 정보의 양은 수십 배로 늘었다. 뿐만 아니라 이를 통해 자신이 관리해야 하는 영역과 요구되는 관리 수준도 그만큼 방대해졌다.
이는 더 많은 통계와 마주치게 된다는 뜻이다. 그 수치들을 이해하지 못한다면 눈뜬장님이나 다름없다. 일정 규모 이상의 회사에서는 막대한 투자를 통해 ERP(Enterprise Resource Planning: 전사적 자원관리 시스템)를 비롯한 다양한 처리(Transaction) 시스템을 구축하고, BI(Business Intelligence: 경영정보 시스템) 등의 분석/정보계 시스템 투자를 통해 회사 업무의 효율성을 제고하려 한다. 이런 시스템에 있는 정보들은 대부분 숫자, 즉 통계로 이루어져 있다.
통계학은 골치 아프다? 아니다. 세상을 좀더 잘 이해할 수 있는 방식이다.
그럼에도 통계와 통계학은 골치 아픈 것, 혼란스러운 것이라는 낙인이 찍혀 있다. 통계학을 싫어하는 사람들 중 많은 사람들은 수학도 역시 좋아하지 않는다. 많은 사람들이 통계학을 생각하면 축구 국가대표 경기 때에나 사용하는 ‘경우의 수'와 ‘순열', 많은 ‘수식'과 난해한 ‘확률분포'를 먼저 떠올린다.
이렇듯 통계학이 수학의 일부분이라는 인식은 초·중·고 교과과정을 통해 굳어진 것이다. 그래서 수학이 싫은 사람은 당연히 통계학도 싫어 한다.
그러나 다행인 것은 통계를 이해하는 수단으로서의 ‘일반인에게 필요한' 통계학은 수학이라기보다 기초 논리학에 가깝다. 때문에 일반인에게 통계학을 설명할 때 수학적인 내용을 제외할 수 있다. 수학을 잘 몰라도 일반적인 통계학은 이해할 수 있는 것이다. 숫자에 대한 초보 논리 지식으로 통계를 볼 수 있으니 덜컥 겁부터 집어먹지 않아도 된다.

통계가 어렵게 느껴지는 상황은 통계가 다루는 대상이 복잡할 때이다. 통계학이란 대상을 정보(보통 숫자)를 통해 표현하고, 이를 잘 공유하기 위한 학문이다. 알아야 할 대상이 복잡하다면 그를 표현하는 표현방식이나 표현의 결과물도 그만큼 복잡할 수밖에 없다.
예를 들어 프랑스어는 특정 단어에 대해 매우 다양한 말로 섬세한 표현이 가능하다. 그래서 프랑스어를 배우는 데는 매우 많은 노력이 든다. 하지만, 익숙해지면 프랑스어를 모르는 사람에 비하면 더 많은 감정표현을 하면서 살게 될 것이다. 통계는 세상을 조금 더 잘 이해하는 썩 괜찮은 방식임에 틀림없다.
통계적 사고로 무장하라
통계학을 공부하면 정말 세상과 현상을 이해하는 눈이 생길까? 점쟁이처럼 앞을 내다보는 능력이 생기는 것은 아니지만 ‘통계적 사고'는 당신을 합리적 사고로 이끌 것이다. 통계적 사고로 무장하는 방법은 다음과 같다.
첫째, 통계 자료의 수집방법과 정의에 관심을 갖는 습관을 들인다.
모든 숫자는 정의(Definition)에 따라 달라진다. 예를 들면, 2007년 교육인적자원부는 전체 고교생 중 66%가 EBS 수능 교육방송을 활용한다고 주장했다. 민주노동당은 EBS 인터넷 서비스 접속 자료를 근거로 11.3%만 듣는다고 발표했다.
똑같은 방송을 놓고 여섯 배나 차이가 난 이유는 무엇일까? 교육부는 당연히 EBS 수능 교육방송의 효과를 주장해야 하는 입장이었고, 그래서 학교의 단체 시청, 어쩌다 한 번 듣는 학생 수까지 모두 이용자로 포함했다. 민노당은 ‘주 1회 이상 시청하는 학생'으로 범위를 많이 좁혀서 계산했다.
통계를 제대로 이용하는 사람은 통계용어의 정의부터 꼼꼼히 점검해야 한다.
둘째, 세분화하여 나누어 보는 방법에 익숙해져야 한다.
통계적 사고란 기본적으로 나누어서 구분해 보는 것이다. 우리의 관심 대상은 본질적으로 다양성을 지니고 있다. 대상이 갖고 있는 ‘다양성'을 우선 염두에 두고, 자료를 나누어서 다양성이 발생하는 형태를 파악하면, 다양성의 원인을 잘 이해할 수 있다.
예를 들어, 어떤 사람이 미국 대학교 입학과정에서 남녀 간의 합격률에 차이가 있고, 이는 성별에 따른 차별이라고 주장하였다. 이에 반해 면밀한 분석가들은 전체 대학이 아니라 학과별로 따로 남녀 합격률을 조사하였다. 그래서 남녀 합격률 차이가 남녀 지원 성향의 차이에 의한 것임을 찾아내었다.
즉, 여학생의 경우, 입학 정원이 많은 학과에는 적게 지원하고, 학과 정원이 적은 학과에 많이 지원하는 경향이 있기 때문이라는 것이다.
적절한 원인을 찾아낼 수 있어야 효과적인 문제 해결이 가능하다.
셋째로 원인과 결과 간의 관계들에 대해 폭넓게 생각할 수 있어야 한다.
인과관계를 명확히 파악하기는 쉽지 않다. 다음의 예를 생각해 보자. 삼성라이온즈 야구단의 선동열 감독이 선수 시절에 어깨가 몹시 아팠던 적이 있다. 당시 많은 팬들이 좋은 음식과 보약, 특효약까지 보내 주었고 물리 치료도 병행하였다.
그 결과 몇 달 후에 어깨가 나았는데, 이 많은 음식, 약, 그리고 치료 중에 어느 것이 어깨를 낫게 하였을까? 음식을 보내 온 사람은 음식 덕이라고 할 것이고, 약사, 물리치료사도 자신의 공을 주장할 수 있다. 그렇지만 이 경우에 어느 것이 진짜 효력을 발휘했는지 구별할 수 없다. 각각의 효과를 밝혀 낼 수 있을 만큼 자료가 충분하지 않기 때문이다. 자료를 통해 각 원인의 효과를 구별하는 방법에 익숙하면 이런 혼란에 대처할 수 있게 된다.
통계학을 공부하여 기존의 관례, 상식, 통념을 새롭게 바라보는 것은 자신에게 도움이 되는 일이지만 어렵고 고단한 일이기도 하다. 그러나 이 격언을 통해 힘을 얻어 보자.
“두 눈을 끔벅거리며 이전의 얼빠진 관례를 따르는 것이, 생각하는 것보다는 훨씬 쉽다.”
잘 생각하기 위해서는 사실을 잘 이해해야 한다. 이를 위해 필요한 통계의 이해 능력을 많은 사람들이 갖추었으면 하는 바람이다. 이번 다섯 회의 연재 칼럼이 독자들에게 통계를 이해하는데 좋은 길잡이가 되었으면 한다.
- 최제호 / 통계학 박사, 디포커스 상무이사, <통계의 미학> 저자