검색과 집단 지성의 절묘한 만남

과거에는 모르는 것이 있으면 아는 사람에게 물어봤다. 그러나 요즘은 검색을 한다. '어떤 것을 많이 검색하느냐'는 것으로 여론을 알아 볼 수 있고 미래를 예측할 수도 있다. 이때문에 검색은 이제 하나의 '보이지 않는 권력'이 되었다. 그런데 이런 검색을 조작하면 어떻게 될까? 바로 '여론 조작'이 일어난다. 우리나라에서는 검색 조작에 대한 이야기가 심심치 않게 등장한다. 또 검색 조작이 문제가 되는 것은 '검색 조작이 바로 여론 조작'이기 때문이다. 그런데 이런 조작을 막을 수 있는 방법이 마땅치 않다. 그래서 등장한 것이 바로 소셜픽이다. 소셜픽은 기존의 실시간 검색어, 인기 검색어와는 달리 SNS의 반응을 반영한다. 검색에 '집단 지성'으로 통하는 소셜을 도입한 것이다. 이 때문에 소셜픽은 실시간 검색어와는 전혀 다른 이슈를 표시한다. 따라서 오늘은 다음에서 최근에 런칭한 소셜픽을 소개할까 한다.

또 다른 권력, 검색


과거와 현재

과거에 정보는 신문을 통해 얻었다. 그러나 첨단 기기의 발전으로 이제 신문에 올라 오는 것은 새로운 소식(News)이 아니라 하루 지난 소식에 불과하다. 이제 신문은 여론을 주도하지 못한다. 여론을 주도하는 것은 포털과 같은 검색 사이트다.

예전에 사람들은 모르는 것이 생기면 아는 사람에게 물어 봤다. 그러나 요즘은 모르는 것이 생기면 검색을 한다. 물론 활자 생활의 역사가 길지 않은 우리나라 사람들은 아직도 검색하는 것 보다는 묻는 것을 좋아하지만주1. 아무튼 이렇다 보니 검색을 통해 미래를 예측하는 것이 어느 정도 가능해 진다주2. 다음 그림은 2008년 미국 대선 당시 오바마(Obama)와 맥케인(McCain)의 구글 트렌드 비교다. 그림을 보면 알 수 있지만 2008년 내내 오바마(파란색)가 맥케인(빨간색)을 앞서고 있다. 투표 당일 날(F)은 오바마의 검색량이 맥케인의 검색량에 5배에 달한다.


오바마와 맥케인

그럼, 우리나라를 보면 어떨까? 일단 구글 트렌드(Google Trend)는 미국 만큼 정확하다고 보기 힘들다. 첫번째 앞에서 이야기 했듯 우리나라 사람들의 성향이다. 우리나라 사람들은 검색하는 것 보다 묻는 것을 좋아한다. 따라서 이런 사람들은 검색어 통계에서 자연스레 빠진다. 두번째로 구글(Google)의 점유율이다. 우니나라는 3대 포털(다음, 네이트, 네이버)의 전체 점유율의 97%에 달한다. 네이트를 뺀 2대 포탈의 점유율만 해도 94%에 달한다. 반면 구글점유율은 고작 2%대에 불과하다. 따라서 전체의 생각으로 보기에는 조금 부족주3하다. 그러나 정확하지는 않다고 해도 구글 트렌드(Google Trend)를 이용하면 우리나라의 트렌드도 어느 정도 짐작할 수 있다. 다음은 구글 트렌드에서 안철수, 문재인, 박근혜를 조회한 것이다.


안철수, 문재인, 박근혜

그림을 보면 알 수 있지만 검색 순위는 안철수(2.25), 박근혜(1.50), 문재인(1.00) 순이다. 그래프를 보면 전반적으로 안철수가 앞서고 있고 가끔 박근혜가 앞선다. 특히 최근 검색 기록()을 보면 박근혜가 안철수를 따라 잡았다가 다시 비슷해졌다. 여기에 바닥을 치던 문재인은 다시 상승하며 안철수, 박근혜 검색량의 절반 정도를 차지하고 있다. 그런데 이 검색 결과는 최근에 나온 여론 조사의 결과와도 상당히 일치한다. 안철수의 검색량이 폭증(②)했을 때는 안철수 원장이 안철수의 생각이라는 책을 출시한 시점이다. 박근혜가 안철수를 따라 잡은 시점(①)은 8월 하반기로 새누리당 경선 후보로 선출됐을 때다.

최근에는 홍사덕의 유신 지지 발언으로 박근혜의 지지율은 추락했고 안철수 원장은 소폭 상승했다. 반면에 문재인 후보는 추락한 박근혜의 지지율을 그대로 받았다. 즉, 박근혜와 안철수가 비슷한 지지율을 형성하고 문재인은 이 두 사람에 비해 크게 상승했다. 아울러 "안철수-문재인 격차가 7.7%로 줄었다"는 여론 조사 결과까지 있다. 앞에서 설명한 것처럼 우리나라의 상황 때문에 구글 트렌드의 결과가 '아주 정확하다'고는 할 수 없다. 그러나 단순히 검색어 통계만으로 어느 정도 여론의 추이는 알 수 있다.

통제 받지 않은 권력, 포털


검색(과거) vs 검색(오늘)

컴퓨터와 인터넷이 보편화되면서 이제 검색일상이 됐다. 아울러 검색어 통계를 활용할 수 있는 포털은 또 하나의 권력이 됐다. 이런 권력의 힘은 언론 권력의 힘을 능가하고 있다. 그러나 그러나 문제는 이런 권력을 통제할 수없다는 점.

우리나라에서는 포털의 검색어 조작에 대한 논란이 종종 있어왔다. 얼마 전에도 비슷한 검색 조작 논란이 있었다. 이때문에 안철수, 박근혜 룸싸롱이 실시간 검색어 상위를 차지하고 심지어 박근혜 콘돔까지 실시간 검색어 1위를 차지하는 웃지 못할 촌극도 벌어졌다. 검색어 조작이 문제가 되는 이유는 간단하다. 검색어 조작이 바로 여론 조작이기 때문이다. 앞에서 설명한 것처럼 검색어 통계만으로 많은 비용을 들이지 않고 여론을 알아 볼 수 있다. 또 검색 통계 데이타를 이용하면 어느 정도 미래에 대한 예측도 가능하다. 실제 "독감이 유행하기 전에 독감에 대한 검색이 증가한다"고 한다.


안철수, 박근혜 실시간 검색어

그런데 만약 검색어 통계를 제어(조작)할 수 있다면 어떻게 될까? 검색어 통계가 여론을 반영하기 때문에 검색어를 조작하면 바로 여론 조작으로 이어진다. 포털의 검색어 조작이 논란이 되는 이유도 검색어 조작이 바로 여론 조작이기 때문이다. 그런데 가장 큰 문제포털에서 검색 조작을 해도 외부에서 알 수 있는 방법이 없다는 점이다. 2007년 이명박 캠프의 진성호는 네이버는 평정됐다는 발언을 했다. 아울러 이 발언은 심각한 사회 문제를 일으겼다. 검색 조작으로 여론을 조작할 수 있다. 따라서 네이버는 평정됐다는 말은 필요하면 얼마든지 여론 조작을 할 수 있다는 말로 들리기 때문이다.

국내 포털에서 제공하는 실시간 검색어여론 조작을 목적으로 하는 사람들의 주된 타겟주4이기도 하다. 포털의 검색어 조작과 이로인한 문제들은 미닉스님의 웹툰, 내리와 민성의 IT 이야기를 읽어 보기 바란다.

집단 지성을 품은 검색, 소셜픽

나는 국내 포털을 거의 이용하지 않는다. 다음, 지도 정도가 사용하는 서비스다. 네이버는 가끔 영화 검색 정도만 사용한다. 특히 포털의 메인 뉴스는 보지 않는다. 이유는 두 가지다. 먼저 메인에 뜬 뉴스가 왜 메인에 뜨는지 알 수 없기 때문이다. 나주에서 잔인한 성폭행이 있었기 때문에 포털 메인에 나주 성폭행범에 대한 기사가 뜨는 것은 당연하다고 본다. 그런데 톱뉴스제1야당 경선에 대한 기사는 없다. 네이버의 경우 총 4개 페이지를 모두 확인해 봤다. 그러나 민주당 경선에 관한 뉴스는 없었다. 대신에 "'남편은 출근했으니...' 이 틈에 성폭행하려 해"나 "윤세아 순간 엉덩이가 하늘을..." 몸매 자랑과 같은 자극적인 제목의 기사들만 눈에 띈다.


네이버 메인 톱뉴스

물론 뉴스캐스트에서 정치를 클릭하면 민주당 경선에 대한 내용이 나온다. 그러나 처음 접속하면 뜨는 화면이 톱뉴스다. 따라서 정치를 클릭하는 것과는 노출도에 큰 차이가 있다. 두번째는 앞에서 설명한 것과 같은 자극적인 기사들과 어뷰징 때문이다. 네이버 뉴스캐스트는 트래픽을 직접 언론사에 준다. 즉, 클릭하면 바로 언론사에 접속, 언론사의 기사가 출력된다. "컨텐츠 생산자에게 트래픽을 주는 것은 좋다"고 생각한다. 그런데 트래픽이 광고 수익과 직결되기 때문에 자극적인 제목, 비슷한 내용의 기사를 제목만 바꿔 반복 전송하는 언론사가 있다.

다음 메인은 네이버와는 달리 두개의 뉴스 페이지가 있다. 접속하면 이 두개의 페이지가 번갈아서 뜬다. 그 중 하나에는 나주 초등생 성폭행 첫 기사이고 나머지 하나에는 문재인, 인천 과반득표로 1위..손학규 2위라는 기사가 첫 기사였다. 즉, 네이버 메인에 비해 다음 메인이 조금 더 균형적으로 보인다.


다음 메인 뉴스

집단 지성과 소셜픽

네이버에서 조작 논란이 많은 이유는 실시간 검색어 처럼 민감한 사항을 시스템에 의존하지 않고 사람들이 직접 관리하기 때문이다. 이 과정에서 "실수로 지웠다". "요청이 있어서 지웠다". "일정량이 되면 차단을 해제한다"와 같은 해명을 한다. 그러나 이런 해명을 사람들이 받아드리지 않는 것은 시스템으로 처리하면 될 부분까지 사람이 하기 때문이다. 그러면 사람 보다는 시스템에 의존하는 다음은 이런 조작 논란에서 자유로울까?

마찬가지다.

시스템으로 하면 사람이 하는 것에 비해 조작 논란은 줄어든다. 그러나 시스템에 의한 방법 역시 조작이 불가능한 것은 아니다. 따라서 빈도는 적지만 조작 논란은 여전히 발생한다. 아무리 우수한 시스템을 구축해도 누군가에 의해서 조작 논란이 일 수 밖에 없다. 조작이 불가능한 시스템은 없을까? 조작이 불가능한 시스템은 존재하지 않는다. 외부에서는 조작이 불가능해도 내부의 조작 가능성이 있기 때문이다. 그러나 최대한 많은 사람들의 의사를 반영하면 이런 논란을 최소화할 수 있다. 현재까지 나온 방법 중 가장 좋은 방법은 집단 지성이다. 집단 지성은 기본적으로 다음과 같은 생각에서 출발한다.

잘못된 정보를 소수에게 계속 유통시킬 수 있다.
잘못된 정보를 다수에게 일시적으로 유통시킬 수 있다.
그러나 잘못된 정보를 다수에게 계속 유통시키는 것은 불가능하다

"국민의 일부를 끝까지 속일 수는 있다. 국민의 전부를 일시적으로 속일 수도 있다. 그러나 모든 국민을 끝까지 속이는 것은 불가능하다."는 아브라함 링컨의 경구를 차용해서 내가 만든 말이다. 아울러 집단 지성을 이야기할 때 가장 자주 인용하는 문장이다. 소셜네트워크(Social Network)에서 잘못된 정보가 널리 유통되는 예는 흔하지 않다. 한 예로 예전의 백분토론을 들 수 있다. SNS 괴담론을 펼치며 'SNS(Social Network Service)때문에 식당이 망했다'는 사람이 있었다. 그런데 '망했다는 사람이 거짓말을 했다'는 것을 집단 지성을 통해 밝혀냈다주5주6. 이처럼 집단 지성은 잘못을 정정할 수 있는 자정 능력을 가지고 있다주7.

소셜픽과 실시간 검색어

따라서 집단 지성을 실시간 검색어와 같은 서비스와 연계하면 포털에서 종종 발생하는 조작 논란은 상당 부분 해소할 수 있을 것이라고 생각한다. 똑 같지는 않겠지만 이런 개념으로 등장한 서비스가 있다. 바로 다음에서 얼마 전 서비스를 시작한 소셜픽(SocialPick)이다. 소셜네트워크의 집단 지성(Social)을 이용, 이슈를 선택(Pick)하는 서비스다. 일단 소셜픽과 실시간 검색어 사이에는 어떤 차이가 있는지 살펴보자. 다음은 다음의 실시간 검색어와 다음이 요새 새롭게 런칭한 소셜픽이다.


실시간 검색어와 소셜픽

1위 부터 10위까지를 살펴보면 실시간 검색어와 소셜픽이 상당히 다르다. 실시간 검색어는 아이유, 유아인, 정글의 범칙, 남자의 자격등 연예 분야로 도배가 되어 있다, 반면 소셜픽은 진보당, 불심검문, 조선일보 사과, 기성용, 박지성, 일본인 서한, 장준하, 충주4대강, 강남스타일, 성폭행등 사회 전반적인 이슈가 고르고 균형있게 분포되어 있다. 실시간 검색어와 소셜픽이 이처럼 서로 다른 경향을 보이는 이유는 몇몇 가지가 있다.

먼저 이 화면을 잡은 시점이다. 이때는 주말이다. 집에서 쉬며 TV를 보거나 영화를 보러갔을 확률이 높다. 따라서 시사 보다는 연예가 집중된 것으로 보인다. 두번째는 통계 기간이다. 소셜픽은 실시간에 비해 이슈를 추출하는 기간이 길다. 따라서 순간적인 검색량으로 결정하는 실시간에 비해 주제 쏠림 현상이 덜할 수 밖에 없다. 세번째 변수는 트윗수다. 검색과 댓글은 알바를 고용하면 어느 정도 상위를 점령할 수 있다주8. 반면에 트윗은 알바를 고용한다고 해도 하나의 이슈를 점령하는 것이 쉽지 않다. 트윗팔로어의 수가 많다고 글이 전파되는 것은 아니기 때문이다.

소셜픽의 헤드라인 옆에는 검색수가 표시되어 있다. 그런데 실제 소셜픽에서는 검색수 외에 트윗수와 댓글수도 포함된다. 즉, 그림에서 검색어는 많은데 순위가 떨어지는 것은 트윗수과 댓글수가 적기 때문에 발생한 현상이다. 다음은 실제 소셜픽 화면이다. 그림을 보면 알 수 있지만 각각의 이슈마다 검색, 트윗, 댓글의 수가 표시되어 있는 것을 알 수 있다.


소셜픽

실제 소셜픽. 아직 별도의 도메인이 없기 때문에 다음에서 '소셜픽'으로 검색해야 볼 수 있다. 검색수, 트윗수, 댓글수를 이용해서 사용자들이 관심을 보인 이슈를 보여준다.

소셜픽 바로가기

어디에도 없는 이슈

소셜픽 1위는 진보당 분당이다. 최근 통합진보당이 분당으로 가면서 올라온 소셜픽이다. 그런데 다음 메인 뉴스나 네이버 메인 뉴스에서는 통합진보당에 대한 뉴스를 찾아 보기 힘들다. 다음 뉴스가 어떤 기준으로 노출되는 것인지는 알 수 없다. 그러나 검색어, 트윗수, 댓글수를 기준으로 잡히는 소셜픽과는 노출되는 이슈상당히 다르다는 것을 알 수 있다. 또 소셜픽은 다음 메인 뉴스에 비해 비교적 기준이 분명하다. 뉴스는 제목만 출력되지만 소셜픽은 상위를 차지하게 된 근거(검색어, 트윗수, 댓글수)가 함께 표시되기 때문이다.


조선일보 사과

소셜픽의 제목은 검색어다. 이 검색어를 클릭하면 검색어와 연관된 기사들이 뜬다. 이 때문에 소셜픽에는 "'남편은 출근했으니...' 이 틈에 성폭행하려 해"나 "윤세아 순간 엉덩이가 하늘을..."과 같은 자극적인 제목이 없다주9. 또 이런 구조라면 언론사에서도 사용자를 끌어들이기 위해 자극적인 제목을 사용하거나 비슷한 내용을 자극적인 제목으로 계속 내보 낼 필요가 없어진다주10.

개선점

다만 몇 가지 아쉬운 점도 보인다. 일단 표시되는 카테고리가 시사, 스포츠, 연예다. 카테고리가 조금 더 많았으면 좋을 것 같다. IT분야가 시사/연예에 비해 인기 없는 것은 사실이다. 그러나 인기는 없지만 꼭 필요한 카테고리라고 생각한다. 두번째로 소셜픽을 클릭하면 뜨는 관련 기사의 량도 좀 늘이는 것이 좋을 것 같다. 한 예로 소셜픽에 올라온 조선일보 사과를 보자(위의 그림 참조). 올라온지 하루가 더된 소셜픽이지만 올라온 기사는 5개에 불과하다. 또 루리웹에 올라온 글은 기사로 보기 힘들기 때문에 루리웹을 빼면 기사의 수3개에 불과한 셈이다. 구글에서 조선일보 사과를 뉴스 검색해 보면 34개가 뜬다.

모르긴 해도 이런 현상이 나타나는 것은 소셜픽에 오르는 기준이 검색, 트윗, 댓글이고 조금 더 끌어 내리면 뉴스 섹션에 관련 뉴스가 있기 때문으로 보인다. 그러나 설사 이렇다고 해도 실시간 베스트 아래에 관련 기사의 제목 링크를 두는 것이 더 좋을 것 같다. 소셜픽은 아직 별도의 도메인이 없다. 따라서 접근하는 방법이 조금 번거롭다. 다음에서 소셜픽을 검색해 들어가야 한다. 소셜픽 자체를 검색의 일부로 보기 때문인 것으로 생각된다. 그러나 접근성을 위해 별도의 도메인을 제공하는 것도 괜찮을 것 같다. OpenAPI도 아직 제공하지 않는다. 이 부분은 아직 서비스 초기이기 때문으로 보이며 나중에 개선될 것으로 생각된다.

마지막으로 내가 보기에는 다음 메인 뉴스에 언론사의 기사를 직접 배치하는 것 보다 소셜픽을 배치하는 것은 어떨까 싶다. 뉴스를 소셜픽으로 대치하는 것이 힘들다면 뉴스 섹션 바로 아래 소셜픽을 두는 것이 정확한 여론 형성을 위해 더 나을 것 같다. 아무튼 소셜픽에 올라오는 이슈가 다양해서 블로그에 소셜픽을 달기 위한 플러그인을 만들었다주11. 다음 처럼 글 중간에 삽입할 수도 있고 스킨 특정 위치에 삽입할 수 있다. 플러그인 기능 시험을 위해 글에도 삽입하고 스킨에도 삽입했다. 따라서 왼쪽 메뉴에서 이슈헌터를 클릭하면 블로그에 달려있는 소셜픽을 확인할 수 있다.

관련 글타래
잠깐만
  1. 우리나라 사람들이 외국인에 비해 조금 더 격정적인 이유도 여기에서 찾을 수 있다.
  2. 이 부분에 대한 조금 더 자세한 내용은 미닉스님의 검색, 마지막 남은 희망 혹은 절망을 보기 바란다.
  3. 여론 조사가 많아야 몇 천명 단위에서 이루어지는 것을 생각하면 2%도 상당히 큰 수치다. 따라서 의미없는 수치는 아니다.
  4. 신정아씨 책에 등장한 진성호, 성상납 의혹을 받은 정우택도 실시간 검색에 뜨자마자 검색어 조작을 시도했고 포털은 이들의 요구를 들어 줬다.
  5. "SNS 괴담론을 펼친 패널 중 한 사람이 백분토론에서 거짓말한 사람을 수사한 검사였다"는 주장도 있다.
  6. SNS 거짓 괴담론을 퍼트린 백분토론은 이 때부터 시청자 전화를 받지 않는다.
  7. 소셜의 자정 능력에 대한 예는 차고 넘친다.
  8. 청와대에 댓글 정규직이 있다는 이야기까지 있다.
  9. 네이버 뉴스캐스트에 낯 뜨거운 제목이 많은 이유는 클릭이 언론사의 트래픽, 최종적으로는 광고수익과 직결되기 때문이다. 반면 다음은 언론사로 직접 연결하지 않기 때문에 낯 뜨거운 제목은 별로 없다.
  10. 다음은 네이버와는 달리 트래픽을 언론사에 직접 주지않는다. 따라서 소셜픽이 아니라고 해도 자극적인 제목은 별로 없다.
  11. OpenAPI가 공개되면 필요가 없는 플러그인이라 따로 공개할 생각은 없다.