21대 총선 승자는 1987년 민주화 이후 최초로 180석을 확보한 더불어민주당뿐만 아니라 빅데이터 분석이었다. 빅데이터 분석으로 미래통합당의 대패 가능성을 선거 이전 이미 엿볼 수 있었다. 또한 선거에서 비호감도가 높으면 낙마 가능성이 크다는 패턴은 빅데이터 분석에서도 그대로 입증됐다. 즉 부정적 연관어 비율이 당락의 직접 변수로 작용하고 있었다. 네거티브 캠페인은 본인과 당의 다른 후보에게 부메랑으로 돌아오는 현상을 보여주었다.
국민일보와 경기대 빅데이터센터·언노운데이터는 공동으로 총선 전인 13일 주요 격전지 6곳의 소셜데이터를 분석해 보도했다. 그 반응은 뜨거웠다. 여론조사 공표 금지기간의 깜깜이 선거를 극복하는 방안으로 주요 격전지 판세를 파악할 수 있었기 때문이다. 초박빙 격전지일수록 댓글과 소셜미디어의 반응은 뜨겁게 나타났다. 관련 기사가 포털의 초기화면 톱기사로 배치됐고, 댓글과 ‘좋아요’가 수천 개를 넘어 전체 수만 건으로 집계될 정도로 높은 관심을 끌었다.
이후 빅데이터분석팀은 선거 전날인 14일까지 소셜데이터를 분석했다. 선거 3일 전부터 당일까지 유권자들의 마인드 변화를 파악하기 위함이었다. 왜냐하면 선거관리위원회가 실시한 19, 20대 총선 유권자 의식조사 결과에 따르면 이 기간에 약 20%가 후보를 선택하기 때문이다. 가장 ‘핫’한 지역구로 여당 실세 중 한 명인 최재성 더불어민주당 후보와 MBC 앵커 출신 배현진 미래통합당 후보가 맞붙은 서울 송파을에서 선거일이 다가올수록 배 후보에 대한 긍정적 연관어 비율이 높아져 결국 배 후보가 승리했다.
청와대 대변인 출신 고민정 민주당 후보와 서울시장 출신 오세훈 통합당 후보가 맞붙은 서울 광진을에서는 선거일이 다가오면서 오 후보에게 긍정적 연관어가 많아지면서 반전의 기회가 있었지만 사전투표에서 져 고 후보가 당선됐다. 오 후보의 경우 같은 당 차명진, 김대호 후보의 ‘막말’ 피해자가 된 셈이다. 판사 출신이자 여성 후보끼리 경쟁한 서울 동작을 역시 언론의 스포트라이트를 받았다. 나경원 통합당 후보의 경우 부정적 연관어 비율이 이수진 민주당 후보보다 약 7% 포인트나 높게 나타나 낙선이 예상됐고 실제 이 후보에게 크게 뒤졌다. 선거 직후 이근형 민주당 전략기획위원장은 “‘국민 밉상’이 된 나경원 후보는 상대하기가 쉬웠다”며 “오세훈 후보가 선전했던 광진을이 가장 힘들었다”고 털어놓았다.
서울 종로에선 이낙연 민주당 후보가 대세론을 이어가 승리했다. 빅데이터 분석에서도 황교안 통합당 후보의 부정적 연관어 비율이 이 후보보다 11% 포인트나 높게 나타났다. 심지어 통합당 지지자지만 ‘이 후보가 친 조국(전 법무부 장관)은 아니기 때문에 이 후보에게 투표하겠다’는 언급까지 포착되기도 했다. 실제 종로구 비례대표의 경우 통합당 자매 정당인 미래한국당이 더불어시민당보다 더 많이 득표했다. 하지만 이 후보는 황 후보를 무려 1만7308표 차이로 누르고 대승했다.
빅데이터 분석이 예측을 비켜간 지역구도 있었다. 대구 수성을은 대권 도전을 선언한 김부겸 민주당 후보와 주호영 통합당 후보가 맞붙어 전국적 관심을 끌었다. 선거 5일 전부터 빅데이터 분석에서 김 후보가 선전하는 것으로 나타났으나 다른 선거 변수가 돌출됐다. 유시민 노무현재단 이사장이 ‘180석’을 전망하면서 대구·경북의 보수 유권자들이 똘똘 뭉쳐 문재인정부 견제론에 표를 던져 주 후보가 큰 차이로 당선됐다. 언노운데이터 서기슬 대표는 “김 후보가 지역에서는 졌지만 전국적 지지의 목소리를 포착할 수 있었다”며 “오히려 타 지역에서 민주당의 전국적인 승리 동력으로 작용했다”고 해석했다.
민주당 싱크탱크인 민주연구원 양정철 원장은 ‘선거는 과학’이라면서 빅데이터 시스템을 선거 전략으로 활용했다. 민주당은 빅데이터라는 첨단 무기를 활용한 반면 통합당은 과거에 매몰돼 선거 전략·전술에도 진 것이다. 경기대 홍성철 교수는 “빅데이터 분석의 강점은 수많은 사람의 표출된 여론을 읽을 수 있고, 나아가 그들의 속내를 파악할 수 있다는 점”이라고 설명한다. 그렇기에 빅데이터 분석은 여론조사와 병행할 때 더욱 강력한 힘을 발휘한다. 4차 산업혁명의 석유이자 반도체인 빅데이터 분석이 선거 예측을 넘어 다른 많은 분야의 분석에도 적극 활용되길 기대해 본다.
김택환 경기대 빅데이터센터 특임교수