인간이 만든 데이터가 인간을 지배하는 ‘ 아이러니’
맞춤 동영상·정책·여론 조사 등
빅데이터, 전 영역 폭넓게 활용
대중 ‘ 객관적 데이터’ 신뢰 구축
검색량, 지선 결과 예측 불일치
인간존재 논리만으로 설명 불가
미래 기술· 알고리즘 맹신 우려

가끔,깜짝 놀랄 때가 있다.유튜브에서 맞춤동영상을 제시해주거나 인터넷 서점에서 ‘당신이 좋아할 만한 책’을 추천해 줄 때,또 “지금 이 책을 클릭한 분들이 다음 책도 클릭하고 있습니다”라는 문구를 확인할 때.그때는 반갑기 보다는 불편한 느낌이 든다.누군가 내 사생활을 감시하고 있다는 안전하지 않은 느낌.

개인이 생성하는 정보를 모아 새로운 정보를 만들고 결론을 도출하는 이 작업은 사실 오랜 시간 이뤄져 왔다.빅데이터,구글트렌드 등 꽤나 세련된 이름을 가진 매력덩어리,모든 정보를 취합하여 정확한 사실을 알려준다는 빅데이터는 우리 사회의 블루오션이 되어가고 있다.

미국의 지난 대통령이었던 버락 오바마가 선거에서 유용하게 활용했다는 이야기가 있은 후,빅데이터에 대한 믿음은 점차 견고해지는 것 같다.일부 여론조사기관에서 실시하는 여론조사가 제각각이고,그것이 표본조사에 근거한 것이며,유선전화 비율이 높아서 젊은 층의 선호도가 제대로 반영되지 않는다는 분석을 들으면 표본조사에 대한 신뢰가 약해지는 것은 사실이다.예전에는 ‘통계자료에 의하면’ 이라는 수식어가 일종의 신뢰감을 주었지만,적당한 거짓과 의뢰기관의 선호도를 최대한 반영한 통계자료를 자주 접하다 보니,그것도 믿을 만한 게 못 된다는 생각이 든다.

반면,빅데이터,구글트렌드에는 자연스럽게 신뢰가 생긴다.실제로 빅데이터는 공공의 영역에서 매우 유용하게 사용되었다.우리나라의 경우,서울시내 버스 노선 변경과 올빼미버스를 도입하는 데 사용되어 서울시 정책만족도 1위를 차지하였고,스페인에서는 스마트 가로등을 도입하여 전력을 30%나 감축했다는 결과도 있다.그뿐인가? 봉준호 감독의 ‘옥자’(okja) 제작사로도 유명한 넷플릭스를 지금의 자리에 있게 만든 것도 빅데이터다.유통회사에 불과했던 넷플릭스는 영국의 BBC에서 드라마 판권을 구입하여 ‘하우스 오브 카드’를 제작하였다.이때 감독과 배우를 빅데이터 분석에 따라 선택하였는데,이는 결과적으로 비용은 적게 들고 시청률은 높은,한마디로 가성비 좋은 드라마의 탄생으로 이어졌다.버락 오바마와 중국의 시진핑도 즐겨본다는 ‘하우스 오브 카드’의 성공은 감독의 직관,배우의 유명세에 따라 드라마의 성패 여부를 점치던 기존의 드라마 제작방식을 바꾸었다는 점에서도 의미가 있다.

상황이 이렇다 보니,빅데이터와 구글트렌드를 블루오션으로 바라보는 시선도 이해가 된다.그런데 빅데이터와 구글 검색량은 정말 모든 것을 다 말해주는 것일까? 스스로에게 이런 질문을 던지다가 지난 지방 선거의 한 후보가 떠올랐다.그 후보는 전통적인 여론조사에서는 줄곧 뒤지고 있었지만,검색량에 있어서는 가장 앞서고 있다면서 승리를 자신했다.그러나 결과는 전통적인 표본조사에 근거한 여론조사,전문가들의 예측이 훨씬 정확한 것으로 나타났다.그 후보 아니라,다른 후보들도 마찬가지였다.검색량과 선호도는 일치하지 않았다.

어떻게 해서 이런 현상이 일어날 수 있을까? 이 현상에 대한 대답을 멀리서 찾을 것도 없었다.생각해보면,나는 내가 지지하는 후보와 그렇지 않은 후보를 검색하는 빈도가 비슷했다.돌발적이거나 이해가 되지 않는 후보의 발언이 있을 때 검색하기도 했고,공감이 되는 연설을 하는 후보에 대해서는 지지 여부와 관계없이 클릭해 보곤 했다.나와 다른 정치적 성향을 가진 사람들과 대화하기 위해서도,고른 관심을 가질 필요가 있었다.그러다보니 모든 후보에 대한 검색량은 비슷했던 것 같다.빅데이터의 관점에서 보자면 나는 유의미한 데이터를 제공하지 않은 셈이 된다.이건 나 개인의 특수 케이스는 아닐 것이다.

우리나라에서도 인기를 얻었던 영화 ‘브리짓 존스의 베이비’에도 빅데이터,알고리즘에 대한 내용이 언급된다.브리짓은 연애정보회사 CEO인 잭과 전 남자친구인 마크 사이에서 갈등한다.잭은 알고리즘에 근거한 브리짓과의 적합도가 97%에 이른다며 브리짓에게 청혼하고,마크 다시는 알고리즘에 근거한 적합도가 8%에 불과하자 절망한다.하지만 브리짓은 알고리즘의 결과와 달리 마크를 선택한다.영화의 흥미로운 전개를 위한 설정이기도 하겠지만,브리짓의 흔한 대답은 때로 감정적이고,논리만으로 설명할 수 없는 인간의 한 측면을 잘 말해준다.“사랑은 계산만으로 되지 않죠.때로 너무 달라서 사랑에 빠지기도 하고,너무 익숙해서 사랑에 빠지기도 하니까요.”

그럼에도 불구하고 빅데이터에 대한 신뢰는 차분히 쌓여갈 것이다.거짓말을 하더라도 데이터는 매우 객관적이라는 일종의 믿음이 있기 때문이다.빅데이터를 맹신하는 한 저자는 심지어 이런 도발적인 제목을 선택했다.‘모두 거짓말을 한다(Everybody Lies).’ 모든 사람들이 거짓말을 하더라도,빅데이터는 거짓말 뒤에 감추어진 인간의 진짜 욕망을 알아내고 말 것이라는 저자의 확신에 찬 제목을 보고 있자니 두렵기도 하다.저자의 주장에 따른다면 언젠가 내 욕망을 말하더라도,데이터와 맞지 않으면 부정될 수 있는 순간도 도래할 수 있으니 말이다.

유발 하라리는 앞으로 새로운 종교는 실험실에서 탄생할 것이라고 주장한다.도래하는 시대에 기술과 알고리즘이 지금까지의 종교가 맡았던 역할을 맡게 될 것이라는 설명이다.그가 예견한 신흥종교인 ‘데이터교’라는 용어를 보고 있자니 복잡한 생각이 든다.인간에 의해 생성된 데이터가 결국 인간을 지배하게 된다는 이 아이러니한 미래,인간은 앞으로 알고리즘의 바다에서 어떻게 살아남아야 할까?

>>> 유강하 교수

연세대에서 중국 고전문학(신화)으로 박사학위를 받았으며 현재 강원대 인문과학연구소 교수로 재직하고 있다.저서로 ‘고전 다시쓰기와 문화 리텔링’ ‘아름다움 그 불멸의 이야기’ 등 10여권이 있다.

저작권자 © 강원도민일보 무단전재 및 재배포 금지