가짜뉴스보다 심각한 가짜 빅데이터가 등장하고 있다. 사진은 특정사실과 관련없음 (사진=Pixabay)
가짜뉴스보다 심각한 가짜 빅데이터가 등장하고 있다. 사진은 특정사실과 관련없음 (사진=Pixabay)

[뉴시안=김도진 기자] 근거를 알 수 없는 가짜뉴스가 작년 한해 심각한 사회문제였다면 올해는 가짜 빅데이터가 그 자리를 차지할 전망이다.

29일 기자가 쓰는 회사메일로 ‘대권주자 SNS정보 리포트’라는 빅데이터 자료가 도착했다. 이 자료는 추후에 카카오톡과 텔레그램 등을 통해서도 기자에게 전달됐다. 빅데이터 분석자료를 살펴보자니 편향성은 상상을 뛰어넘었다.

그럴듯한 그래프와 꼼꼼하게 작성된 표를 보고 있자면 전문 빅데이터 기관이 분석한 결과처럼 보여준다. 하지만 이는 증시 주변에서 흔히 얻을 수 있는 근거가 불분명한 자료를 취합한 결과에 불과하며 이마저도 자의적인 분석으로 왜곡한 결과가 가득했다.

일반적인 빅데이터 분석에서는 ‘여론 관심도’나 ‘여론 방향’ 같은 불분명한 용어는 공식적인 지표로 언급되지 않는다. 하지만 이 리포트는 이런 용어들로만 이루어진 분석이라고 해도 과언이 아닐 만큼 심하게 한쪽으로 쏠린 결과를 위한 자료처럼 보이는 부분이 많았다.

리포트에는 야권의 대선후보로 언급되는 황교안 자유한국당 대표의 ‘댓글 여론 관심도’가 79%로 표시 돼 있다.

댓글여론 관심도 결과를 자세히 살펴보니 내용은 더욱 충격적이다. 황교안 대표의 관심도는 80퍼센트에 근접한 수치이지만 이는 지난달에 비해 무려 9%포인트가 떨어진 상태로 표시 돼 있다.

2위가 오세훈 전 서울시장으로 10.3%이며 이낙연, 유시민, 김경수, 이재명, 박원순의 여권 주자를 모두 합쳐도 2위인 오 전시장보다 낮다. SNS 관심도에서는 이낙연, 김경수, 유시민, 이재명, 황교안, 박원순, 오세훈 순으로 집계됐다.

이 보고서가 전문 빅데이터와 거리가 멀다는 것은 이들 두 조사 결과를 1:1로 동일하게 비중을 매겨 단순하게 평균낸 결과를 ‘SNS와 댓글 여론 종합’이라고 정리했다.

제작사 측은 트위터, 블로그, 인스타그램 및 국내 대형 커뮤니티의 의견과 네이버 뉴스 및 댓글을 종합한 결과라고 밝히고 있다. 가중치 부여없이 같은 비중으로 단순 평균을 낸 후, 이를 빅데이터 분석 결과라며 내놓은 보고서는 입맛에 맞게 통계를 가공한 여론 선동의 도구일 뿐이라는 오해를 불러 일으키기에 충분해 보인다. 

한국여론연구소 이은영 소장은 “여론조사 기관은 질문지 단계에서 검증이 이루어지지만 빅데이터에 기반 했다는 분석의 경우는 현재 규정으로는 무방비 상태”라면서 “이를 제도적으로 막을 수 있는 장치가 필요하다”고 언급했다.

최근 들어 이같은 근거없는 빅데이터 분석 자료가 카카오톡 등의 메신저를 통해 급속도록 보급되면서 여론 왜곡에 동원되고 있다. 가짜뉴스로 몸살을 앓고 있는 정보시대, 이제는 기자들에게도 독자들에게도 진짜와 가짜데이터를 가려야할 지혜가 필요하게 됐다.

저작권자 © 뉴시안 무단전재 및 재배포 금지