세상은 결코 저절로 좋아지지 않는다.
통계학술연구회 공동대표 윤지성
<사진출처 : 네이버 영화 홈페이지>
몇 해 전, 라이프 오브 파이라는 영화를 참 재미있게 봤습니다. 주 내용은 바다 한가운데 홀로 남겨진 주인공의 심리와 생존에 대한 철학적이고 종교적인 해석이 가능한 영화였습니다.
그와 같은 영화에서처럼 우리는 어릴 적 누구나 한번쯤은 무인도에 갇히거나 바다를 홀로 표류하는 상상을 해봤을 것입니다. 만약 그 같은 내용이 상상이 아니라 현실이라면 어떤 기분이 어떨까요?
통계전문가들은 흔히 바다와 데이터를 동일한 대상으로 비유하기도 합니다. 그 크기와 범위를 정확하게 가늠하기 힘들기 때문입니다. 그리스 신화 속 포세이돈이 아닌 이상 태풍이나 풍랑이 매섭게 휘몰아치는 바다 한가운데에서 살아남을 수 있는 방법은 그저 운에 맡길 수밖에 없을 것입니다.
<사진출처 : 네이버 뉴스 - 한국일보 : 빅데이터의 인간농장에서 탈출하라>
오늘을 살아가는 우리는 정보의 바다에 살고 있습니다. 수많은 데이터가 생산되고 공유되는 반복의 과정에 놓여있습니다. 요즘 한창 정보의 생산, 공유와 밀접한 IT나 빅 데이터(Big Data) 등에 관심이 많은 상태입니다. 과학기술의 발전 속도에 따른 지식축적의 속도도 엄청나게 성장하고 있기에 가능한 변화가 아닐까 합니다.
현재 시대에서 살아남기 위해 남과 다른 경쟁력을 확보하는 방법은 정보의 선점이나 다양한 정보의 획득만큼이나 점점 더 중요한 것으로 인식되고 있는 것은 바로 정보의 활용입니다.
지금 시대는 새로운 정보와 지식을 생산하는 것도 중요하지만, 이미 창출된 정보와 지식에 대한 보다 다양하고 차별화된 깊이를 요구한다고 할 수 있습니다. 정보와 지식에 대한 깊이는 결국 그것들이 제시하는 새로운 방향성이나 통찰력(insight)으로 발현되어야 하며, 그 중심에는 반드시 통계학(Statistics)이 필요합니다.
빅데이터 분석이라는 근래의 이슈에는 사실 데이터라는 단어가 분석(통계)이라는 단어보다 더 중요한 것으로 비춰지고 있는 것 또한 사실입니다. 우리가 간과하지 말아야 하는 부분은 바로 여기에 있습니다.
빅데이터 분석에서 가장 단순한 접근방법 중 하나는 텍스트(text)에 대한 빈도분석입니다. 특정기간에 주로 검색이 많이 되는 단어들(동사, 형용사 등)이 무엇인지가 바로 그것입니다. 가장 많이 검색한 단어가 무엇인지 등의 단편적인 정보만으로는 그저 흥미위주에 머물고 말게 됩니다. 단순히 소비하는 정보가 아닌, 실제로 사용할 수 있는 결과를 얻기 위해서는 반드시 통계적 사고와 통계적 분석이 함께 해야 합니다.
어떤 분석을 하기 위해서 어떤 방식으로 데이터를 수집해야 하는지 부터 어떤 데이터로 어떠한 통계분석을 적용할 수 있으며, 적용 후 새롭게 만들어진 결과를 믿을 수 있는지 등에 대한 신뢰성부터 타당성 검토, 관계성과 차이, 영향력에 대한 최종 해석에 이르기까지 통계는 분야를 막론하고 근거를 뒷받침 해주고 원인을 찾아주고 의미를 이끌어 주는 지휘자가 됩니다.
그래서 우리는 통계적 사고와 이해를 위해 기초통계부터 차근차근 배워, 변화과정 중에 있는 새로운 사회에 대한 준비를 체계적으로 할 필요가 있습니다. 통계를 통해서 우리는 남다른 경쟁력을 확보하고 새로운 정보와 지식에 대한 선점우위를 얻을 수도 있고, 통찰력과 방향성을 공유하고 제시하는 새로운 리더가 될 수도 있습니다.
여러분이 원하는 여러분의 미래는 어떻습니까?
“Statistical thinking will be one day as necessary for efficient citizenship as the ability to read and write.”
Herbert G. Wells(영국문명비평가)