Quantcast

[종합] '스트레이트' 네이버-다음 '보수 편중' 뉴스 알고리즘, "여론 왜곡 심각"

이 기사를 공유합니다
(톱스타뉴스 조현우 기자)
'탐사기획 스트레이트'에서 네이버와 다음의 보수 편중 뉴스 알고리즘 문제에 대해 취재했다.
 
MBC 시사교양 프로그램 '스트레이트'
MBC 시사교양 프로그램 '스트레이트'

7일 오후 8시 25분 방송된 MBC 시사교양 프로그램 '탐사기획 스트레이트'에서는 네이버 뉴스의 보수편중에 대해 또 한번 다뤘다. 지난번 12월 PC판의 보수편중에 이어 이번엔 이지선 기자가 또 한번 조사 기간을 늘려 모바일판도 집중 분석했다. 언론사별 기사 송고량이 달라 그렇게 된 것이라는 네이버의 해명에, 스트레이트측은 평일 기준 4주를 평균내 순위를 매겨보았다.

조회수와 관심도가 집중되는 MY뉴스판 점유율 1위였던 연합뉴스는 뉴스 통신 특성상 기사 송고량이 가장 많았다. 그러나 MY뉴스 점유율 1위였던 중앙일보는 21개 중 14위에 불과했다. 4위였던 조선일보 역시 기사 송고량은 18위였고, 동아일보 역시 기사 송고량은 16위에 불과했다. 19위로 조선일보와 기사  송고량이 비슷했던 경향신문은 MY뉴스 점유율이 19위로 조선일보와 큰 차이를 보였다.

네이버에서 구독자 수가 많은 언론사의 기사가 더 많이 MY뉴스 판에 노출되는 것도 아니었다. 이 부분에 대해서 전문가들은 "네이버가 답을 해야 하는 부분"이라 전했다. 이에 대해 네이버는 "MY뉴스는 인공지능이 임의로 기사를 추천하되 구독자수 많은 언론사에 가중치를 두고 있으며 뉴스 추천 알고리즘에서 매체 성향을 분류하지 않고 있다"고 해명했다.

PC에 이어 모바일 또한 보수 언론 편중 현상을 뚜렷하게 보이는 가운데, 성장경은 "우리나라 언론 지형 자체가 보수 언론이 많고 진보 언론은 적잖아요. 혹시 이 현실이 그대로 반영된 게 아닐까요"라고 물었다. 이에 이지선 기자는 "그걸 감안하더라도 진보와 보수의 노출 차이가 48:3이라는 건 납득하기 어렵다"고 전했다.

허일후는 "그 정도 차이라면 굉장히 큰데요"라고 얘기했고, 이지선 기자는 "방금 전해드린 보수 편중 현상은 로그인하지 않은 상태에서 뉴스를 볼 때 나타나는 현상이잖아요. 로그인을 한 상태에서는 인공지능이 개인 성향을 반영해 뉴스를 추천해준다, 이렇게 네이버는 밝히고 있습니다. 정말 그런지 조사 결과를 알려드리겠습니다"라고 취재 영상을 다시금 공개했다.

네이버 인공지능 에어스 홍보영상을 보면 "알아서 척척 사용자가 원하는 정보를 제공한다"나온다. 이 에어스의 핵심 기술 중 하나인 협력 필터링 기술은 뉴스 소비를 분석해 유사 성향자들이 많이 본 기사를 추천해주는 방식을 차용한다. 이어 또 다른 핵심 기술로는 인공신경망 기술이 있다. 클릭 순서, 체류 시간, 소비 패턴을 파악해 이용하는 기술이다.

문서임베딩, 딥러닝 기술을 활용해 사용자에게 정확하고 정교한 추천을 한다는 에어스 홍보 문구. 스트레이트측은 네이버 아이디를 새로 만들어 서로 다른 성향을 학습시켜 보았다. 보수 성향 아이디로는 조선일보, 중앙일보의 정치, 경제, 사회 기사를 5분에 1개씩 정독하게 했다. 진보 성향 아이디는 경향신문, 한겨레 신문의 정치, 경제, 사회 기사를 5분에 1개씩 정독하게 했다. 단순히 클릭하는 것만이 아니라 하나의 기사를 천천히 스크롤하면서 내려가도록 설계했다.

에어스 추천 뉴스는 최근 7일 동안의 사용자 활동을 통해 맞춤 뉴스를 추천한다 밝히고 있다. 성향 학습 2주 뒤, 네이버 인공지능은 두 개의 아이디에 어떤 뉴스를 MY뉴스로 추천했을까. 먼저 보수 성향 아이디다. 학습이 끝난 다음 날, 중앙일보의 기사를 가장 많이 추천해주었다. 2위는 연합뉴스, 3위는 KBS, 4위는 조선일보였다. 5위는 YTN으로 밝혀졌다.

진보 성향 아이디는 1위로 연합뉴스, 2위는 중앙일보, 3위 조선일보, 4위 KBS, 5위는 SBS였다. 경향신문과 한겨레 기사 외에는 그 어떤 기사도 클릭한 적이 없는 아이디였다. 그런데도 MY뉴스로 보수, 중도 언론만 추천됐고 한겨레와 경향신문이 추천된 비율은 20위 권 안에도 들지 못했다.

극단적으로 다른 성향의 기사만 클릭한 두 아이디. 그러나 추천된 기사는 모두 보수와 중도 성향. 두 아이디에 큰 차이가 없었다. 혹시 2주라는 학습 기간이 너무 짧았던 걸까. 기사 선택 영역이 너무 넓어서, 성향이 선명하게 드러나지 않았던 건 아닐까. 그래서 학습 조건을 더 선명하게 바꿔보기로 했다.

또 다른 신규 아이디 2개를 생성해 이번엔 정치 경제 사회가 아닌 정치 영역 기사만 학습시키도록 했다. 기간도 3주 이상으로 길게 잡았다. 결과는 어떨까. 먼저 보수 ID. 3주간 5분의 1개씩 조선, 중앙일보 정치면 기사만 정독했다. 학습을 마친 다음 날인 2월 5일, MY뉴스에 가장 많이 노출된 언론사는 1위 머니투데이, 2위 데일리안, 3위는 뉴스1, 4위는 국민일보, 5위는 연합뉴스였다. 이번에도 보수와 중도 성향 매체가 추천됐다.

이번엔 진보ID다. 같은 방식으로 경향신문 혹은 한겨레 정치 기사만 정독했다. MY뉴스에 가장 많이 올라온 통신사는 1위 뉴스1, 2위 연합뉴스, 3위 국민일보, 4위 데일리안, 4위 중앙일보를 추천했다. 납득하기 어려운 결과다. 보수 언론 기사만 봐도 보수, 중도 기사가 추천됐고 진보 언론 기사만 봐도 보수와 중도 언론사의 기사만 올라갔다는 게 결론이다.

경향신문 디지털뉴스편집장 김정근은 "꾹민들이 올바른 판단을 할 수 있게끔 만들어주는 게 중요하다"며 "올바른 여론 형성에 바람직하지 않은 현상"이라 전했다. 상지대 교양학부 송경재 교수는 "이 데이터상으로 본다면 상당히 충격적인 결과"라고 말했다. "인공지능을 통해서 객관적으로 중립적으로 되고 있다고 선전해왔었잖아요. 그런데 그런 것들이 전부 거짓일 수 있다는 것이 데이터상에서 나타났기 때문에 이 부분은 분명히 해명해야 할 부분이며 검증도 같이 이뤄져야 할 것"이라고 그는 덧붙였다.

이에 네이버는 "실제 특정 언론사 기사만 읽는 이용자는 매우 적어 특이한 현상이 벌어질 수 있다며 이를 일반화할 수 없다"고 반박했다. 이에 못지않게 이해가 안 가는 조사 결과가 또 있다며 이지선 기자는 전했다. '언론사별 가장 많이 본 뉴스' 또한 편중되어 있다는 것이다.

분야별 인기 뉴스를 보여주던 랭킹 뉴스. 즉 많이 본 뉴스 코너는 네이버 뉴스의 핵심 서비스였다. 지금 사람들이 관심 있는 뉴스는 이것이라고 보여주면서 더 많은 클릭을 유도하는 것이다. 많이 본 뉴스에 올라가면 클릭 수는 폭발적으로 는다. 랭킹이 랭킹을 낳는 지경이 된다. 기사 제목은 갈수록 선정적으로 변했고 언론사들은 경쟁적으로 속보와 단독을 붙여댔다.

비판이 거세지자 결국 네이버는 작년 10월 '많이 본 뉴스'를 폐지했다. 대신 각 언론사별 가장 많이 본 뉴스 코너를 만들었다. 네이버는 관여하지 않고 각 언론사가 추천하는 많이 본 뉴스만 노출시킨다. 이용자에게 처음 노출되는 화면엔 다섯 개 언론사에 많이 본 뉴스가 뜬다. 다섯 개 언론사가 한 세트로 총 14개 세트, 70개 언론사가 언론사별 많이 본 뉴스에 기사를 공급한다. 하지만 이용자가 직접 우측의 작은 '더보기' 화살표를 누르지 않는 한, 첫 번째 세트엔 다섯 개 언론사 기사만 지속적 노출된다. 10분 뒤엔 다른 언론사들로 넘어가게 설정되어 있다.

모바일은 뉴스 탭에서 스크롤해야 보이는 아래쪽에 노출된다. 그러나 검색 탭에서는 바로 볼 수 있게 설정할 수 있다. PC의 경우 뉴스 홈 첫 화면 오른쪽에 자리잡고 있어 이용자들에게 곧바로 노출된다. 따라서 이 첫 화면에 노출되는 지가 클릭수에 큰 영향을 미친다.

스트레이트측은 언론사별 많이 본 뉴스가 언론사별로 어떻게 갱신되고 있는지 조사했다. 지난 2월 3일 오후 4시 10분부터 5시 10분까지 노출된 언론사별 가장 많이 본 뉴스의 첫 묶음들이다. 먼저 오후 4시 10분이다. 조선일보와 중앙일보, JTBC, 연합뉴스와 연합뉴스TV가 올라와 있다. 이후에도 계속이 판이 바뀌는데도 조선일보, JTBC, 중앙일보 등이 연속해 등장한다.

TV조선까지 따지면 조선일보 또한 네 번째 연속으로 등장하는 셈이다. 오후 4시 50분, 한국경제가 세 번째로 등장한다. 오후 5시, JTBC와 TV조선, 조선일보가 반복해 등장한다. 5시 10분, JTBC, 중앙일보, YTN이 다섯 번, 세 번이 넘게 등장했다. 만약 서로 다른 언론사들이 세트로 등장했다면, 이지선 기자의 관찰 실험에서는 다양한 언론사들이 등장했어야 한다. 

이 가운데 10개 언론사가 두 차례 이상 중복 노출됐다. JTBC가 60분 노출됐고 조선일보가 40분 노출됐다. 중앙일보도 30분, 한국경제와 YTN도 30분 동안 노출됐다. 하필 이 날 이 시간대에만 우연히 이런 중복 노출이 발생했던 걸까? 스트레이트측은 작년부터 언론사별 가장 많이 본 뉴스를 70일 통계를 내 조사했다.

조사 결과 1위는 JTBC, 2위는 중앙일보, 3위는 조선일보, 4위는 YTN, 5위는 한국경제로 나왔다. 이들이 첫 판에 나온 언론사 수의 47.2%를 차지하고 있었다. 이렇게 첫 판에 노출이 되면 클릭수는 같이 높아질 수밖에 없다. 네이버 언론사별 가장 많이 본 뉴스에 기사를 제공하는 언론사는 모두 72곳. 이 가운데 52곳의 언론사는 첫 화면 점유율이 1%도 안됐다.

여성신문 등 17개 언론사는 조사 기간 동안 첫 판에 단 한번도 노출이 되지 않았다. 이에 대해 네이버는 "언론사별 많이 본 뉴스 코너 역시 구독자수 많은 매체가 먼저 보이게 될 확률이 높다"고 말했다. 송경재 교수는 "과거에 우리가 인터넷 언론 초창기에 나타났었던 여론 공론장 기능은 점점 퇴색해가고 오히려 그 이전처럼 주류 언론들, 소수의 언론 등이 다시 그 플랫폼의 상위에 랭크되어 버리는 과거의 잘못된 전통으로 회귀하는 그러한 현상도 나타나고 있는 것 같습니다"라고 얘기했다. 

진보 언론인 한겨레신문의 경우 이 코너에 거의 등장하지 않는다며 이지선 기자는 말하면서 "점유율이 2%도 안됐다. 구독자 수도 392만이다"라고 전했다. 성경장이 카카오 다음에 대해 물어보자, 이지선 기자는 카카오 다음 뉴스도 취재했다며 취재 결과를 공개했다.

네이버와 마찬가지로 다음 모바일 헤드라인을 5분에 1개씩 정독한 후 확인했다. 1위는 연합뉴스, 2위는 뉴스1, 3위는 뉴시스, 4위는 JTBC, 5위는 MBC였다. 뉴스통신 3사의 점유율만 45.9%. 무려 절반에 가깝다. 헤드라인에 채택된 기사 전체를 놓고 보면 뉴스통신 3사 다음으로 중도언론이 32.6%, 보수언론이 18%였다. 하지만 진보언론 기사는 3.5%에 불과했다.

네이버 MY뉴스와 비교해보면 네이버는 보수언론사, 다음은 뉴스통신사가 압도적 비중을 보였고 둘 다 진보성향은 찾아보기가 거의 힘들었다. 카카오의 실시간 추천 루빅스의 딥러닝 기술도 확인해봤다. 다음 역시 이용자의 성향을 학습해 맞춤형 기사를 제공해준다고 밝힌 바 있다. 개인의 뉴스 제공 성향을 얼마나 관여하는지 네이버와 같은 방법으로 조사해봤다. 역시 신규 아이디 두 개를 만들었고 정치 경제 사회 분야를 대상으로 하나는 조선과 중앙일보 기사를 하나는 경향신문이나 한겨레 기사를 읽게 했다.

학습 기간은 2주. 5분에 1번씩 접속해 조건에 맞는 기사를 정독시켰다. 조건에 맞는 기사가 나오지 않으면 어떠한 행위도 하지 않고 넘어가게끔 설계했다. 보수 성향 ID와 진보 성향 ID에 추천된 언론사들을 비교해봤다. 1위는 둘 다 연합뉴스, 2위와 3위는 서로 순서가 바뀌었을 뿐 4위와 7위까지 완전히 순위가 똑같다. 

이번엔 또 다시 성향 학습 기간을 3주로 늘려 시도해보았다. 하지만 이번에도 1위부터 4위까지의 순위가 모두 같았고, 5위와 7위도 차이가 한 군데 빼고 없었다. 그 한 군데도 진보 성향 언론은 아니었다. 인공지능이 뉴스를 보는 사용자의 성향을 학습했다면 나올 수 없는 결과다. 스트레이트측 조사 결과에 대해 다음측은 이렇게 해명했다. "다음은 뉴스 알고리즘이 이용자의 성별이나 연령대, 관심사는 감안하지만 언론사 선호 여부나 정치적 성향은 반영하지 않는다"는 것이다.

뉴스통신 3사 집중 노출에 대해서도 물으니 "알고리즘에 기사의 시의성과 언론사별 기사량이 많이 반영된 것으로 추정된다"고 말하며 "편중 현상에 대해 인지는 하고 있으나 아직 구체적인 알고리즘 개편 계획을 갖고 있진 않다"고 다음 측은 전했다. 고려대 정보보호대학원 김승주 교수는 "사람이 하느냐 AI가 하느냐 중요한 게 아니고 사람들이 그 시스템을 신뢰할 수 있게끔 만들 수 있겠는가, 설명할 수 있겠는가 이게 중요하단 거예요"라고 지적했다.

AI 알고리즘도 비공개고, 원칙이나 기준을 설명해주지도 않으니, 국민들의 알 권리는 사라져 있다. 이지선 기자는 "인공지능의 뉴스 편집에 뭔가 이상한 점이 있는데 납득이 가능하게 설명하지 않는다는 게 문제인 것 같다"고 말했다. 인공지능에게 포털뉴스라는 공론장을 맡겨도 되는지, AI에게 맡긴다는 이유로 책임을 회피하고 있는 건 아닌지 스트레이트측은 문제를 제기한다. 

김승주 교수는 "인공지능은 완벽하지 않아요. 아주 작은 허점에 바보처럼 구는 경우가 있어요"라며 제대로 된 '단독'기사를 구분하지 못하는 인공지능의 허점에 대해 얘기했다. 기사가 추구하는 가치가 올바른지, 의미있는 심층 기사인지 등을 판단하기 어려운 인공지능의 현실이다.

전북대 신문방송학과 유경한 교수는 "공론장에서 필수적으로 봐야 하는 정보들이나 뉴스들을 충분히 제공하고 있느냐, 사실 이게 가장 큰 운영원칙이 되어야 한다고 할 수 있는데 이런 게 반영이 되지 않고 있단 거죠. 이용자 선호 말고 그것과 별개의 운영 원칙들이 있어야 하지 않을까 하는 생각"이라 말했다.

전 세계적으로 알고리즘의 편향이 발생할 수 있단 우려가 강하게 제기되고 있고, 이것을 조금 더 사회적으로 설명 가능한 기업의 책임, 사회적 책임을 강화해야 한다는 견해들이 높아지고 있다고 전문가들은 지적한다. 포털의 뉴스 편중 현상은 심각한 여론 편중 현상을 만들어낸다는 점에서 매우 심각한 문제다. 그 영향력에 걸맞은 책임에 대해 진지하게 고민해볼 필요가 있겠다. 

MBC 시사교양 프로그램 '탐사기획 스트레이트'는 매주 일요일 오후 8시 25분 방송되며 유튜브 등으로도 송출되고 있다.
이 기사를 공유합니다

 

모두에게 알리고 싶은 뉴스라면 ? ‘이 기사를 추천합니다’ 버튼을 눌러주세요.
추천을 많이 받은 기사는 ‘독자 추천 뉴스’에 노출됩니다.

240201_광고보고투표권

기사 추천 기사를 추천하면 투표권을 받을 수 있습니다.
If you recommend an article, you can get a voting ticket.


모바일 모드로 보기 Go to the Mobile page 모바일 모드로 보기 Go to the Mobile page.

이 기사를 후원해 주세요


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.



해외토픽