가짜뉴스가 궁금하다.

이렇게까지 했는데 보지 않고 넘어갈 수 있겠어?

시작

뉴스가 생성되고 전파되는 속도가 엄청나게 빨라졌다. 과거에 우리는 종이 신문이나 TV, 라디오를 통해 뉴스를 접했다. 아직 이러한 매체들이 남아있기는 하지만 지금은 스마트폰만 열면 포털, 앱, 소셜미디어, 인터넷 커뮤니티, 톡 프로그램 등을 통해 언제 어디서나 뉴스를 접할 수 있다. 뉴스가 한번 배포되면 수십만 명의 사람들이 거의 동시에 볼 수 있는 세상이다.

그러나 이러한 발전에도 불구하고 뉴스를 접하는 일이 점점 더 피곤하게 느껴진다. 쏟아지는 뉴스의 양이 너무 많아지기도 했지만, 언젠가부터 의심스러운 뉴스가 많아졌기 때문이다. 검증이 잘 되지 않은, 왜곡되거나 꾸며진, 엉뚱하게 해석되거나 포장된 뉴스, 그리고 뉴스를 가장한 홍보물들이 우리를 현혹하기 때문이다. 우리는 뉴스를 볼 때마다 “이거 혹시 가짜뉴스 아니야?”라고 의심할 수 밖에 없는 세상에 살고 있는 것이다.

식별하기 어렵거나 식별되었어도 몰랐을 뿐, 과거에도 가짜뉴스는 있었을 것이다. 그럼에도 불구하고 최근에 들어서 가짜뉴스로 인한 피로감이 더 커진 이유는 과거에 비해 가짜뉴스가 많아져서일 수도 있지만, 뉴스가 생성, 전파되는 속도 만큼이나 가짜뉴스의 존재를 파악하게 되는 속도도 함께 빨라졌기 때문일 것이다. 뉴스가 생성되는 즉시 많은 사람들이 보게 되며 그 내용에 대한 다양한 의견들이 빠르게 공유되는데, 이러한 과정에서 사람들에 의해 가짜뉴스가 빠르게 식별되는 것이다. 차라리 존재를 몰랐다면 마음이라도 편하겠지만, 별 생각없이 믿었던 뉴스가 얼마 지나지 않아 잘못된 보도로 판명되는 일이 많아지는 것이다.

우리가 가짜뉴스의 존재와 가짜뉴스가 만들어 내는 문제의 심각성에 대해 인식하게 된 것은 꽤 오래 전이다. 그럼에도 불구하고, 오늘도 변함없이 누군가에 의해 가짜뉴스가 만들어지고 있으며, 많은 사람들이 가짜뉴스에 속고 있다. 우리 모두는 가짜뉴스의 영향력에서 쉽게 벗어날 수 없다.

이쯤 되니, 가짜뉴스에 대해 알아보고 싶은 욕망이 생긴다. 일단, 가짜뉴스의 정체가 궁금하다. 누가, 어떤 목적으로 가짜뉴스를 만들고 있는지, 그리고 어떻게 전파되는지 알고 싶어진다. 우리가 가짜뉴스에 속는 이유도 궁금하다. 더 나아가서, 인공지능 기술이 나날이 발전한다는데, 가짜뉴스를 식별해 내는 똑똑한 소프트웨어를 만들 수는 없는지 궁금해진다. 이 모든 것들에 대해 완벽하게 파악하는 것은 쉽지 않겠지만, 그래도 한번 시작해 보자.

저는 가짜뉴스를 말하지 않습니다만.

가짜뉴스는 무엇이며, 왜 분석되어야 하는가?

넓은 관점에서 정의하자면, 가짜뉴스는 틀린 뉴스이다. [2] 아니 뭐 이렇게 뻔한 정의도 있나 싶겠지만, 이 정의는 가짜뉴스가 담고 있는 내용의 진실성과 형식에 초점을 맞춘 것이다. 뉴스의 형식은 갖추었는데 잘못된 내용을 담고 있는 것이라는 설명이다. (그러나 사실, 엄밀히 따지고 보면, 뉴스는 이미 사실(Fact)을 전제로 하기 때문에 사실이 아닌 내용을 뉴스라고 부를 수는 없다. ‘가짜’와 ‘뉴스’는 섞일 수 없는 개념인 것이다.) 약간 더 좁히자면, 가짜뉴스는 뉴스 아울렛(outlet)에 의해 보도되는 의도적으로 틀린 뉴스이다. [2] 여기서 말하는 뉴스 아울렛은 CNN, Newyork Times 등과 같은 언론매체를 의미한다. 이 정의는 ‘의도’까지 언급하고 있다. 즉, 가짜뉴스는 틀린 내용을 의도적으로 담은 뉴스이다. 실수로 틀린 내용을 담은 뉴스는 가짜뉴스에 해당되지 않는다는 것이다. 더 나아가서, 신문사, 방송국 등과 같이 전형적인 언론 매체에 의해 보도된 것이어야 한다는 점을 내포한다. 한번 더 좁히자면, 가짜뉴스는 정치, 경제적, 또는 사회적인 이득을 얻을 목적으로 언론매체에 의해 보도되는 의도적으로 틀린 뉴스이다. 이 정의는 가짜뉴스의 목적을 ‘이득’의 개념을 통해 추가하여 앞선 정의를 확장하고 있다. 사실, 가짜뉴스의 정의에 대한 것만으로도 꽤 많은 연구 결과들이 존재하므로, 일단 이번 글에서는 이 정도로 정의해 두자.

사실 이 정의가 썩 마음에 들지는 않는다. 왠지 최근의 실제적인 뉴스 소비 환경에는 맞지 않는 것 같아 보이기 때문이다. 최근에는 일반인들도 일부러 가짜뉴스를 만들어 공유할 수 있고 소셜 미디어나 개인 동영상 채널에서도 많은 수의 가짜뉴스가 직접 생산, 유통되고 있지 않은가. 뉴스로 배포된 콘텐츠들 중에도 최소한의 형식 – 6하 원칙에 기반한 내용, 핵심내용의 출처, 발행일, 발행기관, 작성자 정보 등 – 을 제대로 갖추지 않은 것들이 많지 않은가. 그러나, 일단 이런 정의가 있다는 점을 염두에 두자. 잘 생각해 보면 [2]에서 비교적 간단명료하게 정의를 한 이유를 짐작해 볼 수 있는데, 다루어야 할 가짜뉴스의 범위가 너무 넓어지면 연구하는 과정이 너무 힘들어질 것 같다.

[3]에서도 다음과 같은 것들은 가짜뉴스에 포함되지 않는다고 언급하고 있다.

  • 사람들을 속이려는 목적이 없는 풍자
  • 뉴스에서 시작되지 않은 루머
  • 진실 여부를 판단하기 힘든 음모
  • 의도와 상관없이, 사실이라고 믿을 만한 이유가 충분한 상태에서 만들어진 오보
  • 즐거움을 위해 특정인을 속이는 행위

정리하면, 의도가 확실히 불순해야 하고, 확실히 잘못된 정보를 담고 있어야 하며, 뉴스의 형식을 갖춰야 가짜뉴스로 분류할 수 있다는 것이다. 이렇게 보니 위에서 내린 정의가 크게 부족해 보이지는 않는다. (후속 편에서 가짜뉴스를 자동적으로 식별해 내는 방법에 대해 알아볼 계획인데, 자동 식별 방법을 연구개발하는 입장에서는 가짜뉴스의 정의에 포함되는 ‘의도성’ 요소가 가장 머리 아플 듯 하다.)

가짜뉴스는, 특히 정치 관련 뉴스일 경우, 진실된 뉴스보다 더 빨리, 더 많은 사람에게 퍼진다는 연구결과가 있다. [4] 일을 제대로 하지 않고 국민을 위하는 척 하지만 실제로는 자신들의 안위에만 신경을 쓰면서 포장된 이미지로만 먹고 사는 정치인들이 많고 이런 이미지만을 보고 정치인들을 지지하는 사람들이 많다는 점을 생각해 보면 당연한 이야기 같다. 감추고 포장하고 왜곡하면 사람들을 속여서 자신들의 정치적 목적을 달성할 수 있을 테니까 말이다. 물론 연예인이나 스포츠 스타와 같은 유명인에 대한 가짜뉴스, 국내 및 국제 정세에 대한 왜곡, 과학기술의 발전 추세나 세부적 결과에 대한 과장된 홍보 등도 우리가 늘 접하는 가짜뉴스들이다.

이러한 가짜뉴스는 뉴스 생태계의 신뢰 밸런스를 깬다. (물론 이미 한국의 언론에 대한 신뢰도는 매우 낮지만.) 더 나아가 가짜뉴스는 편향된, 잘못된 믿음을 받아들이게 하여 사람들이 뉴스를 받아들이고 해석하는 방식에도 심각한 악영향을 미친다. 가짜뉴스들 중에는 일부러 사람들의 불신과 혼란을 야기시켜서 진실과 거짓을 구분하기 어렵게 만드는 것을 목적으로 만들어지는 것들도 있으니 [3] 한 마디로 가짜뉴스는 사회악이다. 그런데, 지금 이 순간에도 불신과 거짓을 통해 자신의 이익을 취하려는 누군가에 의해 가짜뉴스가 만들어지고 있다.

이러한 거창한 관점은 접어두더라도, 개인적으로도 가짜뉴스에 속는 것은 무척 자존심 상하는 일이 아닐 수 없다. 가짜뉴스를 만들어 내는 사람들의 꼭두각시가 될 수는 없다. 자신들이 만들어 낸 가짜뉴스에 영향을 받는 사람들을 지켜보며 미소를 짓고 있을 가짜뉴스 생성자들에게 더 이상 당하고 싶지 않다. 이제는 가짜뉴스 생성자들을 대상으로 반격을 해야 한다. 그런데 반격을 하려면 반격 대상이 보이는 특성에 대해 최대한 많이 알아두어야 한다.

간단하게 살펴보는 가짜뉴스의 심리학

가짜뉴스는 개인의 심리적 취약성을 파고든다. 사람들은 일반적으로 자신이 현실을 제대로 보고 있다고 믿는다. [35] 자신의 관점에 동의하지 않는 사람들에 대해서는 교육이 부족하다거나, 비이성적이고 편향적이라고 평가한다. 사람들은 자신이 가지고 있는 관점과 일치하는 정보를 다른 것들에 비해 크게 선호한다. [25] 이러한 취약성에 가짜뉴스가 더해져서 잘못된 인식(오해)이 한번 만들어지면 쉽게 수정되지 않는 것이다.

정치와 관련된 이슈에 대해 필자도 나름대로의 개인적 시각을 가지고 있는데, 필자와 전혀 다른 시각을 가진 사람들을 보게 되면 그들을 이해할 수 없다는 생각을 자주 하게 된다. 솔직히 말하면 “그들은 왜 자신의 관점을 남에게 전적으로 의지하는가” 하는 의문까지 든다. 조금만 더 신경써서 공부하고 알아보면 저런 시각을 가질 수 없을 거라는 생각을 하면서 말이다. 기술과 관련된 이슈에 대해서도 마찬가지인데, 기술에 대한 세부적인 내용이나 기술 개발 정책의 방향에 대해 필자가 가진 생각과 유사한 관점으로 작성된 뉴스나 블로그 글에 대해서는 매우 편향적으로 긍정적인 평가를 하게 된다. 이러한 필자의 생각과 행동에는 전혀 문제가 없는 것일까. 당연히 문제의 소지가 있다.

게임이론의 관점[28]에서는 뉴스를 생성하고 소비하는 과정을 2명의 플레이어가 활동하는 전략게임으로 본다. 뉴스 출판자와 소비자는 각각 자신의 utility를 최대화하려고 한다. 뉴스 출판자의 단기 utility는 뉴스 소비자 수를 최대화하여 이득을 높이는 것이며 장기적인 utility는 뉴스의 정확도를 바탕으로 얻게 되는 명성이다. 뉴스 소비자의 utility는 정확하고 편향성 없는 정보를 얻고자 하는 information utility와 자신의 관점과 기호를 만족시키는 뉴스를 받는 것에 해당하는 psychology utility로 구성된다. 가짜뉴스는 뉴스 출판자의 단기 utility가 지배적일 때, 뉴스 소비자의 psychology utility가 지배적일 때 생긴다. [3] 이 설명대로라면, 무언가에 의해 뉴스 출판자와 소비자들이 특정 utility에만 집중하게 되고, 그것이 가짜뉴스를 만들고 소비하게 하는 핵심적인 역할을 한다고 정리할 수 있을 것이다. 그 ‘무언가’는 무엇일까 궁금하다.

우리는 왜 가짜뉴스에 속는가?

내가 가진 믿음이 항상 옳은 것일 수는 없다. 심지어 내가 가진 판단력의 정확도와 믿음의 정도가 적절한 것이라고 할 지라도, 특정 사실을 접하고 믿는 과정은 암묵적 기억(implicit memory) 속에 내재되어 있는 기존의 경험과 선입견, 정치적 관점, 판단의 유연성 정도, 소속된 사회적 집단의 특성과 그 집단 내에서 자신이 처한 상황 등에 의해 큰 영향을 받는다. [5] 그리고 이들 중에는 정확한 정보를 식별하는 것을 방해하는 작용을 하는 것들이 포함되어 있다. 이것이 신중한 사람들 마저 가짜뉴스에 속게 되는 이유이다.

정치적 동기에 의한 진실 판별 오류

과거에는 믿음의 정확도에 영향을 주는 가장 큰 요소들 중 하나로 “정치적 동기”가 가장 많이 언급되었다. [1] 정치적 동기를 가진 뉴스 소비자들은 자신의 정치적 기호나 성향에 맞는 콘텐츠에 대해서는 과도하게 신뢰하게 되며 그렇지 않은 콘텐츠에 대해서는 지나치게 회의적인 관점을 가지게 되어 진실을 구분하는데 실패한다. 뉴스로부터 사실(Fact)이 아닌 믿음(Belief)을 받아들이는 것이다.

물론 이러한 설명이 주는 의미는 크지만, 정치적 동기와 무관한 뉴스들 중에도 가짜뉴스가 많이 생성되고 사람들이 속는다는 점을 설명하는 데에는 한계가 있어 보인다.

뉴스가 너무 많아

Reasoning 과정의 부족

사람의 인지과정에는 크게 나누어 2가지 종류의 프로세스가 포함된다. [6, 44] Type 1 (or System 1)은 정보나 자극이 주어지면 직관에 의해 바로 반응하는 프로세스이며, Type 2 (or System 2)는 깊은 생각과 분석을 통해 진행되는 프로세스이다. Type 1 프로세스가 만들어 낸 결과를 Type 2 프로세스가 바로잡으면서 가짜뉴스에 대한 잘못된 믿음을 줄일 수 있다. 가장 대표적인 예는 뉴스의 제목만으로 판단하지 않고 전체 뉴스를 다 보고 다양한 분석을 거친 후에 판단하는 것이다. [7] 실제로 분석적 사고는 정치 뉴스 컨텐츠에서의 진실 식별에 긍정적인 역할을 한다. [8,9] 이와 유사하게, 과학적 지식은 COVID-19에 대한 잘못된 지식을 식별하는데 긍정적인 역할을 했다. [10]

그러나 현대인들은 정보의 홍수 속에서 살아가고 있다. 다양한 미디어를 통해 짧은 시간동안 많은 뉴스를 접하기 때문에 뉴스에 대해 분석적인 인지 프로세스를 적용하는 것에는 한계가 있을 수 밖에 없다. [43] 뉴스의 헤드라인 또는 서두만 보거나 다른 사람에 의해 요약, 해석된 내용을 통해 뉴스를 접하게 되는 것이다. 그리고 이것은 지나치게 자극적이거나 왜곡된 헤드라인을 쓰는 것이 가짜뉴스의 대표적인 특성으로 나타나게 하는 이유이기도 하다. 이것은 다음에 설명할 휴리스틱(Heuristic)과도 관련된다.

불완전한 사전지식

Type 2 프로세스에 의한 분석적인 사고과정이 항상 옳은 결과를 낳는다고 볼 수는 없는데, 불완전하고 부정확한 사전 지식을 바탕으로 분석 프로세스가 진행될 수 있기 때문이다. 예를 들어, 특정 정치파나 정치인이 배포하는 미디어만 소비하게 되어 사전 지식이 심각하게 왜곡되어 있을 경우 분석적 사고는 뉴스의 진실성에 대한 판단의 정확도를 높이지 못한다. [11] 추론 과정이나 추론 능력의 문제가 아니라 사전지식이 불완전하고 부정확하여 진실을 식별하지 못하게 되는 것이다.

Heuristics이 지닌 내재적 오류

사람들은 뉴스의 헤드라인을 보고 다양한 휴리스틱(Heuristics)을 사용하여 판단한다. 분석적인 사고나 추론 보다는 경험을 기반으로 어림잡아 판단하는 경우가 많은 것인데, 자신도 모르게 이루어지기도 하는 이 과정에 의해 가짜뉴스에 속게 된다.

가장 대표적인 휴리스틱의 요소는 친숙도(familarity)인데, 과거에 여러 번 접했던 헤드라인에 대해서는 쉽게 믿게 되는 것이다. [12, 13] 사람들은 가짜뉴스일 지라도 자주 접하는 정보를 좀 더 선호하게 되므로 자주 노출되게 하는 것으로도 해당 정보에 대해 호의적인 반응을 일으킬 수 있다.[16, 17] 가짜뉴스를 믿거나 배포하는 행위의 정도는 가짜뉴스에 노출되는 빈도가 높을 수록 커지는데 [15, 21] 친숙함이 가짜뉴스를 믿게 할 수 있다는 것이다. 진실과 상관없이 특정인이나 단체에 대해 부정적으로 작성한 기사에 반복해서 노출되면 자신도 모르게 해당 인물이나 단체에 대해 부정적인 편견을 가지게 되며, 이와 반대로 긍정적인 뉴스에 의해 긍정적인 편견이 생긴다. 명시적 기억(explicit memory)이 반복적 노출에 의한 강화(reinforcement)과정을 거쳐 암묵적 기억(implicit memory)이 되어 자신도 모르게 휴리스틱으로 활용되는 것이다.

사람들은 뉴스의 신뢰도를 파악할 때 해당 뉴스의 출처(source)를 활용하기도 한다. 자신이 신뢰하는 사람이나 출처가 제공한 정보를 더 믿는 경향이 있기 때문이다. 정보 출처가 낯설 때에는 다른 사람들이 그 정보 출처를 얼마나 신뢰하는가를 바탕으로 자신의 신뢰도를 결정한다. 특히 유명인들의 메시지에 큰 영향을 받으며 [14] 이것은 유명인들이 소셜 미디어 상에서 많은 follower를 보유하고 있다는 것과 관련된다. ‘좋아요’와 같이 포털이나 소셜 미디어에서 제공하는 피드백도 뉴스 컨텐츠에 대한 주관적인 신뢰도를 높인다. 소셜미디어 사용자들은 마인드가 비슷한 사람의 그룹을 만들게 되어 의견이 한쪽으로 치우칠 수 있다. [15, 22]

더 나아가 감정적인 요소도 휴리스틱 요소들 중 하나인데, 뉴스 헤드라인에 드러난 감정적인 요소 – 두려움, 화 [18,19], 또는 도덕적 분노(moral outrage) [20] – 가 사람들로 하여금 해당 뉴스에 속을 가능성을 높인다.

이외에도, 사람들은 자신이 바라고 있거나 자신을 기쁘게 하는 정보 또는 이미 가지고 있던 믿음과 부합하는 정보를 더 믿는 경향이 있다. [25, 26, 27]

새로운 매체에 의한 진실 판별 오류

라디오가 새로운 매체로 등장했을 때 화성인이 지구를 침공한다는 내용의 드라마가 라디오를 통해 방송되어 그 내용을 그대로 믿은 사람들이 크게 놀라 대피하는 황당한 일도 있었다. 이것은 새로운 매체를 통해 접하는 콘텐츠에 대해서는 그 출처에 대해 신경을 덜 쓰게 되는 경향이 있다는 사실을 보여주는 가장 대표적인 예이다. [42, 43] 웹 포털을 통해 뉴스를 보던 사람이 소셜미디어나 메신저를 통해 뉴스를 접하게 되면, 텍스트만으로 작성된 기사를 보던 사람이 동영상으로 잘 만들어진 기사를 보게 되면, 언론사를 통해서 뉴스를 보던 사람이 개인 동영상 채널이나 팟캐스트 등을 구독하여 뉴스를 보게 되면 뉴스의 출처나 퀄리티를 덜 고려하게 되어 가짜뉴스에 속을 가능성이 높아지는 것이다. 더 나아가 최근의 새로운 뉴스 매체들은 과거의 매체에 비해 빠른 시간에 뉴스를 생성하고 전달하며, 뉴스 소비자들도 짧게 요약된 형태의 뉴스를 빨리 확인하는 패턴에 점점 익숙해져가고 있다. 이것은 뉴스를 조작하는 과정과 조작된 뉴스를 전달하는 과정을 더욱 쉬워지게 하며 가짜뉴스에 속게 될 가능성을 높인다.

가짜뉴스는 왜 확산되는가?

잘못된 내용을 담고 있음에도 불구하고 가짜뉴스가 왜 확산되는가에 대한 여러가지 설명이 있다. 특정 사용자가 소셜 미디어 상에서 뉴스를 공유할 지의 여부를 결정하는 과정에서 정확도를 크게 고려하지 않는 경우가 많다는 것이 대표적이다. [10, 37] 이것을 the accuracy–sharing dissociation [1]이라고 하는데, 이러한 현상을 설명하는 여러가지 관점이 있다.

첫째, 사람들은 자신이 공유하는 잘못된 뉴스를 진정으로 진실이라고 믿기 때문에 공유한다.

둘째, 잘못된 정보일 가능성을 알고 있으면서도 다른 사람들로부터 인정을 받기 위해 뉴스를 공유한다. [38, 39] 사람의 선택과정은 현재 상태와 비교했을 때의 이득과 손해를 고려하여서 이루어진다. [29, 30] 선택에 의한 이득을 최대화하고자 하는 욕망은 사회적 이득에도 적용되어 소셜 커뮤니티 내에서 다른 사람들로부터 지속적으로 받아들여지기를 원하게 된다. 따라서 특정 커뮤니티에 받아들여지기 위해 가짜뉴스를 공유하는 행동을 할 수 있다. [5, 23, 33, 34] 사회적으로 받아들여지는 것은 한 사람의 정체성과 자존감에 있어 매우 중요하기 때문에, 뉴스를 공유할 때 뉴스의 진실성 보다는 소속 커뮤니티가 부과하는 기준을 더 따르는 선택을 하는 것이다.

세째, 정치적 관심을 끌거나 혼란을 퍼뜨릴 목적을 가지고 있거나, 진실이라고 밝혀지면 흥미로울 것 같을 경우에도 뉴스 내용의 진실성에 상관없이 공유 동기가 커진다.

네째, 정확한 정보를 공유하려는 의도를 가지고 있으나, 신중한 생각이 부족하거나 소셜 커뮤니티 내에서의 맥락(context)에 의해 정확성에 대한 주의력이 떨어져 가짜뉴스를 공유한다.

마지막으로, 최근에는 누구나 쉽게 특별한 비용없이 소셜미디어 계정을 만들 수 있으므로 소셜봇, 트롤 등과 같은 악의적인 계정이 생겨나고 이러한 계정들에 의해 가짜뉴스가 확산된다. 소셜봇은 소프트웨어로 동작하는 소셜 미디어 계정으로서, 2016년의 미국 대선에서 큰 규모로 트윗을 날려 온라인 상의 정보를 크게 왜곡시켰다. [40] 트롤은 사용자들로 하여금 감정적인 반응을 하게 하여 온라인 커뮤니티를 어지럽게 할 목적으로 사람에 의해 만들어지고 활동하는 계정으로, 소셜미디어 상의 가짜뉴스의 전파에 가장 중요한 역할을 담당한다. 특히 트롤은 화, 두려움, 의심, 불신, 비이성적 행동 등과 같은 부정적 감정을 불러일으키기도 한다. [41]

가짜뉴스에 대응하기 위해 어떠한 노력들이 이루어져 왔는가?

그렇다면, 가짜뉴스에 대응하기 위해 지금까지 어떤 노력들이 이루어져 왔는가 궁금해진다.

첫번째는 일반 대중을 대상으로 가짜뉴스에 대한 정보를 제공하여 가짜뉴스에 대한 의식을 고취하는 것이다. 물론 이 방법은 대중에게 제공할 정보의 형식과 내용을 신중하게 디자인해야 한다는 점과 사람들의 참여를 이끌어낼 방법도 함께 고민해야 한다는 어려움을 동반한다.

두번째, 팩트체크 전문가로 하여금 가짜뉴스에 대해 경고를 달아주어 가짜뉴스의 실제 존재를 인식하게 하는 방법이 있다. 이 방법도 어느 정도 효과적일 수 있으나 가짜뉴스를 판단하는 과정을 일일이 수동으로 진행해야 하므로 너무 큰 시간과 노력이 든다는 점이 문제가 된다. 가짜뉴스의 분야도 다양하므로, 각 분야의 팩트체크 전문가를 확보하는 일도 쉽지 않다. 결국 빠르게 진화하는 정보 패턴을 따라가는데 한계가 있다. 더 나아가 모든 뉴스에 대한 검토과정이 이루어지지 않을 경우에는 경고가 붙지 않은 뉴스를 무조건 진실된 뉴스로 믿게 하는 부작용이 발생할 수도 있다.

세번째, 일반 대중으로 하여금 뉴스에 대해 직접 평가하도록 고안된 인터페이스를 제공하는 방법이다. 이 방법을 활용하면 개별 뉴스에 대한 평가 결과도 얻을 수 있는데, 적은 수의 전문가보다는 많은 수의 일반 대중에 의한 대용량의 평가 결과가 더 정확하다는 전제를 바탕으로 한다. 무작위로 선택된 뉴스 헤드라인들에 대해 다수의 일반 사용자들로부터 평가 결과를 수집하게 되면 그 과정 자체만으로도 뉴스 정확도에 대한 인식을 고취시킬 수 있고 가짜뉴스의 특성을 연구하는데 활용할 수 있는 대용량의 데이터를 확보하는데에도 도움이 될 수 있다. 이 방법은 사용자가 뉴스를 선택할 때마다 뉴스의 내용에 대해 좀 더 신중하게 고민하도록 하는 메시지를 띄워 주거나 뉴스의 정확성에 대한 평가결과를 입력할 수 있는 팝업 창을 띄우는 방법이 대표적인데, 어떠한 방식을 쓰던 간에 사용자를 성가시게 한다는 것이 큰 단점이다. 최근에 페이스북에서는 COVID-19와 관련된 포스트를 공유하려고 할 경우 포스트의 내용을 신중하게 평가하라는 의미의 내용을 담은 메시지를 띄우기도 한다.

네번째, 모든 뉴스에 대해 뉴스 발행처 정보를 눈에 쉽게 보이도록 강조하는 방법이 있다. 물론 이 방법은 신뢰할 수 있는 뉴스 발행처와 그렇지 않은 발행처를 사람들이 잘 구분할 수 있다는 가정을 전제로 한다.

이 외에도, 기술적으로 가짜뉴스를 자동 식별하려는 시도가 있다. 인공지능, 머신러닝, 자연어 처리, Network analysis 등과 같은 방법론을 바탕으로 가짜뉴스를 자동으로 식별하는 컴퓨터 시스템을 만들고자 하는 것이다. 그러나 뉴스가 담고 있는 내용의 진실 여부가 명확하지 않을 때가 많고 진실 여부에 대해 전문가들 사이에서도 의견 차이가 나는 경우가 많기 때문에 좋은 학습 데이터를 구하기가 쉽지 않다. 또한 머신러닝 방법론을 쓸 경우에는 가짜뉴스를 식별할 때 쓸 수 있는 feature를 찾아내거나 만들어야 하는데, 이 과정도 쉽지 않다. 좋은 feature와 알고리즘을 구현하는데 성공한다고 하더라도 알고리즘이 잘못된 판단을 할 가능성은 늘 존재한다. 심지어 가짜뉴스는 시간에 따라 진화하고 새로운 형태의 가짜뉴스가 계속 생성되기 때문에 한번 구현한 결과를 계속 쓸 수는 없으며 진화하는 가짜뉴스에 대응하기 위해 구현결과를 지속적으로 개선해 나가야 한다는 어려움이 있다.

가짜뉴스에 휘둘리지 않기 위한 노력

가장 먼저, 뉴스 생태계의 개선, 법, 제도적 장치의 마련 등과 같은 사회적인 노력이 필요할 것이다. 최근에 큰 주목을 받고 있는 언론중재법이 대표적인 예다. 그러나 사회적인 노력에 의한 결과를 얻으려면 꽤 오랜 시간을 기다려야 할 것이다. 불행한 것은 지금 이 순간에도 가짜뉴스가 지속적으로 생산되고 유통된다는 사실이다. 무작정 기다릴 수만은 없는 노릇이다.

가짜뉴스에 속지 않기 위해 개인적으로 해볼 수 있는 것들도 있을 것이다. 또한 소수의 인원이 큰 변화를 이끌어낼 수 있는 가장 확실한 방법은 가짜뉴스를 자동 식별하는 시스템을 개발하는 것일 수 있다.

개인적인 노력

가장 먼저, 다른 사람이 쓴 글에서 사실을 말하는 부분과 의견 및 추측을 말하는 부분을 구분하는 노력이 필요할 것이다. 가짜뉴스에는 사실처럼 작성된 의견이나 추측들이 많이 포함되기 때문이다. 그리고 그러한 의견과 추측은 기사 작성자의 개인적인 생각에서 나온 것일 수도 있고, 전문가나 타인의 발언을 근거로 한 것처럼 포장된 것일 수도 있다. 그러나, 뉴스의 내용에서 사실과 사실이 아닌 것을 구분하는 것은 쉽지 않다. 뉴스를 보는 사람의 입장에서는 뉴스가 언급하는 내용을 직접 보거나 들은 것이 아니기 때문이다. 무엇보다 모든 뉴스를 이렇게 분석하고 고민하면서 본다는 것은 불가능한 일이기 때문이다.

그래도 가짜뉴스에 속는다는 것은 무척 자존심 상하는 일이므로, 뉴스를 접하면, 웬만하면 본문까지 다 보되, 자신의 성향이나 기호, 관점과 일치하는가의 여부와 무관하게 일단 의심하는 습관이 필요할 것이다. 이런 내용을 이렇게 말하는 기사도 있다는, 더 나아가 같은 내용을 다르게 보는 사람도 충분히 있을 수 있다는 정도로 받아들이는 것이다. 임팩트가 큰 뉴스일 수록, 사람들의 관심사가 집중될 뉴스일 수록 후속 보도가 나올테니, 후속보도를 기다릴 필요도 있을 것이다. 특히 본문이 없는 속보일 경우에는 이런 자세가 매우 중요할 것이다.

이렇게 뉴스를 보려고 하다 보면, 뉴스를 보는 것이 너무 힘들게 느껴져서 아예 뉴스를 멀리하게 될 지도 모르겠다. 그리고 사람들로 하여금 뉴스를 멀리하게 하고 자신과 직접 관련되지 않은 일들에는 아예 관심을 끊게 하는 것이 가짜뉴스를 생산하는 사람들이 달성하고자 하는 주요 목표들 중의 하나일 지도 모르겠다. 하지만, 가짜뉴스에 속는 것 만큼이나 가짜뉴스 생산자들의 이러한 불순한 의도에 휘둘리는 것 또한 자존심 상하는 일이 아닐까. 모든 개별 뉴스들을 이렇게 피곤하게 볼 수는 없더라도, 자신의 주 관심분야에 대한 뉴스를 볼 때만이라도 이러한 노력을 기울여보는 것은 큰 의미가 있을 것이다.

가짜뉴스에 속지 않기 위한 휴리스틱

정치적 집단처럼 행동하는 언론매체들은 높은 클릭 수와 조회 수, 그리고 관심을 받기 위해 뉴스를 배포한다. 이러한 경우에는 뉴스 내용의 정확성을 크게 고려하지 않는다. 더 나아가 이슈를 만들고 사람들의 관심을 끌어내거나 현재의 관심을 다른 방향으로 끌기 위해서라면 집단 간, 세대 간, 남녀 간, 지역 간, 그리고 빈부 격차에 의한 갈등을 꾸며내거나 심화시키기 위한 일도 망설이지 않고 한다. 그리고 이러한 일에 쓰이는 가장 효과적인 도구들 중의 하나가 가짜뉴스인 것이다.

가짜뉴스에 속는 이유들 중의 하나로 뉴스를 접하는 사람들이 활용하게 되는 휴리스틱이 지닌 내재적 오류를 언급한 바 있다. 그렇다면 뉴스가 포함하고 있는 정보의 품질과 정확도를 평가하기 위해서 활용할 수 있는 휴리스틱은 없을까? 완벽한 휴리스틱을 기대하기는 어렵겠지만 그래도 활용할 만한 가치가 있는 것들은 없을까? 이러한 휴리스틱들을 강화(reinforcement)할 방법은 없을까?

가장 먼저, 너무 자극적인 어휘로 제목을 작성한 뉴스나 눈길을 사로잡는 썸네일로 포장된 뉴스는 보지 않는다. Clickbait 일 가능성이 크기 때문이다. Clickbait란 내용에 상관없이 사람들의 관심을 끌고 클릭을 유도하기 위해 현란한 텍스트나 그림 형태로 포장해 놓은 링크를 말한다. 직접인용된 문장이 제목에 포함된 경우에도 보지 않는다. 혹시 보게 되더라도 쉽게 믿지 않는다.

동일한 제목의 뉴스가 여러 매체를 통해 반복되는 것을 해당 뉴스의 임팩트가 강하다는 것으로 무조건 받아들이지 않는다. 한 매체에서 이미 배포한 뉴스를 뉴스의 정확도나 중요도를 고려하지 않은 채 복사해서 붙여넣는 식으로 그대로 재배포하는 행태가 만연해 있기 때문이다. 이러한 행태는 매체의 수익을 올리기 위한 것일 수도 있고 정치적인 의도에 의한 것일 수도 있다. 물론 해당 언론 매체의 직접 취재 능력이 부족하기 때문일 수도 있다. 어떤 이유든 간에 이러한 보도 패턴을 보이는 매체는 의심한다.

작성자의 개인적인 가치판단이 들어간 문장이 발견되면 더 이상 읽지 않는다. 개인적인 의견에 지나지 않는 글을 뉴스처럼 배포하는 언론 매체들이 꽤 많기 때문이다. 이러한 글들은 칼럼이나 블로그에 어울리는 것이지 뉴스 기사가 아니다.

본문의 내용에 다음과 같은 표현 또는 이들과 유사한 표현이 포함되어 있을 경우에는 해당 뉴스의 신뢰성을 더욱 의심해 봐야 한다.

  • 관계자에 의하면, 법조계에 따르면, 학계에 따르면
  • 익명의 제보자에 의하면
  • 시민 김모(40)씨에 의하면
  • 일부 네티즌에 의하면
  • A씨는, B씨는
  • \~라고 알려졌다.
  • \~라는 지적이 나온다.
  • \~일 수도 있다.

제목이 언급한 내용과 실제 본문의 내용이 다른 기사는 철저하게 무시한다. 이러한 패턴은 작성자가 의도한 것일 수 있고 작성자의 기사 작성 수준이 낮은 것이 이유일 수도 있으므로 기사의 내용을 믿지 않는다. 기사 작성 능력의 부족이 원인이라면, 짧은 시간에 작성 능력을 키울 수는 없으므로 해당 기사의 작성자가 앞으로 쓸 기사의 신뢰도가 갑자기 높아지기는 어려울 것이다. 따라서 기사를 쓴 작성자를 기억해 두고 해당 작성자의 뉴스는 보지 않거나 의심한다.

뉴스의 핵심이 되는 사안에 대해 한 쪽의 시각만 언급한 뉴스는 믿지 않는다. 입장이 엇갈리는 사람들의 시각을 모두 다루는 것은 뉴스의 기본이기 때문이다.

식별된 가짜뉴스를 많이 배포한 언론 매체, 정정보도가 많은 언론 매체의 뉴스는 보지 않는다. 반복되는 오류는 실수가 아니기 때문이다.

최근에는 과거의 뉴스를 검색해 볼 수 있으므로, 동일한 사안에 대해 해당 매체가 과거에도 뉴스를 보도했다면, 당시에는 어떤 시각으로 뉴스를 작성했는지 찾아본다. 동일한 사안에 대하여 손바닥 뒤집듯이 관점을 바꾸는 행위는 사실 전달을 목적으로 하지 않는 것이다.

뉴스에 달린 댓글을 볼 때에는 댓글의 내용과 문체가 일정 수준 이상일 경우에만 참고한다. 공개적으로 댓글을 쓰는 곳에 감정의 배설물을 남기는 행위를 거리낌 없이 하는 사람이 하는 말을 믿을 필요는 없다. 또한 의도적인 여론 조성을 위해 조작된 댓글을 다는 경우가 많다는 것도 잊지 않는다.

구체적인 정책, 연구 결과나 기술에 대한 설명을 바탕으로 한 기사는 관련자료를 직접 확인하기 전에는 신뢰하지 않는다. 예를 들어, 최근에 들어서는 코로나 방역과 관련하여 해외 학술 자료나 해외의 기사를 발췌하여 싣는 뉴스들이 많았는데, 이들 중에는 자료에 언급된 내용을 왜곡하거나 데이터를 잘못 해석하여 독자들을 혼란에 빠뜨리는 것들이 있었기 때문이다. 국민의 건강과 생명에 직접 관련된 사안임에도 불구하고 이런 일이 발생한 것이다. 더 나아가 신뢰할 수 없는 학술지의 내용을 인용하는 경우도 있을 수 있다. 정책에 관한 뉴스의 경우에는 정부의 정책을 과신하게 하거나 무조건 비판하게 하기 위한 목적으로 작성되는 것들이 있으므로, 유명한 전문가에 의해 작성된 것이라고 해도 무조건 받아들이는 것은 위험하다.

특정 연구기관이나 기업의 과학기술 연구개발의 성과를 소개하는 뉴스들 중에는 해당 기술을 발표한 학술논문에 대한 출처 정보가 전혀 포함되어 있지 않거나 소개 내용 자체가 과장된 것들이 많다. ‘세계 최초’ 또는 ‘국내 최초’와 같은 수식어를 붙이거나 초기 연구임에도 불구하고 개발결과의 효율이 100%에 근접하는 것처럼 묘사되는 경우가 가장 대표적이다. 이런 뉴스들 중에는 기관이나 기업의 홍보를 목적으로 해당 기관이나 기업에서 고의적으로 보도자료에 과장된 표현을 쓰는 것이 원인일 수 있다. 한편으로는 뉴스 작성자의 과학기술 지식이 부족한 상황에 이슈를 만들고자 하는 목적이 더해져서 이러한 뉴스가 보도되기도 한다. 기업으로부터 돈을 받고 뉴스를 실어주는 언론매체들도 많다.

나 인공지능인데, 내가 가짜뉴스를 콕 짚어주겠어.

기술적인 노력

가짜뉴스를 식별하는데 활용할 수 있는 휴리스틱이 있다는 것은 좋은 일이다. 그러나 모든 뉴스를 볼 때마다 이렇게 깊은 분석과 고민을 해야 한다면 차라리 뉴스를 보지 않는 것이 낫겠다는 생각이 들 것이다. 그렇다고 해서 뉴스 작성자들의 양심에만 맡기거나 모든 뉴스에 대해 전문가들이 팩트 체크를 할 수도 없다.

그렇다면, 자동으로 가짜뉴스를 식별해 주는 인공지능 시스템이 나온다면 어떨까? 매일 쏟아지는 수많은 뉴스들 중에서 가짜뉴스를 실시간으로 정확하게 짚어주거나, 적어도 특정 뉴스가 가짜뉴스일 확률을 실시간으로 측정해 주는 시스템을 사용할 수 있다면 어떨까?

알고리즘, 기계학습, 자연어처리 등과 같은 분야를 전공했다면, 가짜뉴스를 자동적으로 식별, 탐지하기 위한 연구가 많이 이루어져 왔다는 점을 알고 있을 것이다. 실제로 이러한 방법이 만들어진다면, 중요한 사회적 문제가 소수의 연구개발자에 의해 해결되는 대표적인 예가 될 수 있고, 해당 연구개발자의 보람은 매우 클 것이다.

그러나, 가짜뉴스가 오랜 시간동안 뉴스 생태계를 위협해 왔음에도 불구하고 여전히 사회적 문제로 남아있고 우리가 활용할 수 있는 자동 탐지 시스템이 아직 눈에 띄지 않는 것으로 볼 때, 기술 기반 접근방식으로 실제적인 결과를 내는 것이 쉽지는 않을 것이라는 짐작을 할 수 있다.

이쯤 되면, 가짜뉴스를 식별, 탐지하는 것과 관련된 분야의 기술을 전공한 호기심 많고 용기 있는 연구개발자라면, 가짜뉴스를 자동적으로 식별하기 위한 연구개발이 어떤 접근방식을 취해 왔는지, 해당 결과가 어느 정도의 수준까지 와 있는지, 더 나아가 개인적으로 직접 구현해 보는 것은 가능할 지 등에 대해 알아보고 싶은 마음이 들 것이다. 이 주제에 대해서는 후속 글에서 소개해 볼 예정이다.

One more thing?

지금까지 이 글을 모두 읽었다면, 이 글에 대해서도 다양한 평가를 할 수 있을 것이다. 나름대로 자료조사도 좀 한 것 같고, 참고문헌도 제시하고 있으니 논문 같기도 하고 믿을 수 있어 보이기도 한다. 그런데 논문이라면 실제적인 연구 데이터를 제시해야 하는 것 아닐까? 심지어 이 글에는 필자의 주관적인 주장도 꽤 들어있는 것 같지 않은가? 무엇보다, 이 글을 쓴 필자가 가짜뉴스에 대해서 얼마나 제대로 알고 있는지 불분명하지 않은가?

이와 같은 내용을 꼼꼼하게 따져보는 것도 흥미로울 수 있다. 이 글에는 논문처럼 착실하게 출처를 제시한 부분들과 출처나 근거를 대지 않고 개인적인 생각과 주관적인 주장을 풀어낸 부분들이 뒤섞여 있다. 필자의 약력은 둘째치고, 필자가 누군지도 확실하지 않다. 이 글은 뉴스기사도 아니고 사회적 파급력이 클 것 같지도 않지만, 이 글에서 제시한 휴리스틱들을 직접 활용하여 이 글의 신뢰성을 평가해 보는 것도 재미있을 것이다.

이 글의 신뢰성에 대한 평가 결과가 좋지 않다면, 필자는 가짜뉴스의 자동 식별 방법에 대해 쓸 후속 글로 만회해 볼 계획임을 미리 밝혀둔다.

References

  • [1] https://www.sciencedirect.com/science/article/pii/S1364661321000516
  • [2] https://arxiv.org/abs/1812.00315
  • [3] https://arxiv.org/abs/1708.01967
  • [4] https://www.science.org/doi/abs/10.1126/science.aap9559
  • [5] https://oxford.universitypressscholarship.com/view/10.1093/acprof:oso/9780195092509.001.0001/acprof-9780195092509
  • [6] https://www.sciencedirect.com/science/article/abs/pii/B9780128000908000020
  • [7] https://cognitiveresearchjournal.springeropen.com/articles/10.1186/s41235-021-00292-3
  • [8] https://www.tandfonline.com/doi/abs/10.1080/10584609.2020.1744778?journalCode=upcp20
  • [9] https://www.pnas.org/content/118/5/e2020043118
  • [10] https://journals.sagepub.com/doi/full/10.1177/0956797620939054
  • [11] https://www.sciencedirect.com/science/article/abs/pii/S0010027720301943
  • [12] https://pubmed.ncbi.nlm.nih.gov/30247057/
  • [13] https://onlinelibrary.wiley.com/doi/abs/10.1002/acp.3684
  • [14] https://www.cambridge.org/core/books/nature-and-origins-of-mass-opinion/70B1485D3A9CFF55ADCCDD42FC7E926A
  • [15] https://www.pnas.org/content/118/9/e2023301118
  • [16] https://psycnet.apa.org/record/1968-12019-001
  • [17] https://journals.sagepub.com/doi/10.1111/1467-8721.00154
  • [18] https://pubmed.ncbi.nlm.nih.gov/33325331/
  • [19] https://www.cogitatiopress.com/mediaandcommunication/article/view/1519
  • [20] https://www.nature.com/articles/s41562-017-0213-3
  • [21] https://journals.sagepub.com/doi/10.1177/0146167294203006
  • [22] https://www.jstor.org/stable/1882692?origin=JSTOR-pdf
  • [23] https://psycnet.apa.org/record/1957-02366-001
  • [24] https://chicagounbound.uchicago.edu/cgi/viewcontent.cgi?article=12209&context=journal_articles
  • [25] https://journals.sagepub.com/doi/10.1037/1089-2680.2.2.175
  • [26] https://www.sciencedirect.com/science/article/abs/pii/S0065260108601033
  • [27] https://psycnet.apa.org/record/1994-05497-001
  • [28] https://www.nber.org/system/files/working_papers/w19880/w19880.pdf
  • [29] https://www.jstor.org/stable/1914185
  • [30] https://link.springer.com/article/10.1007/BF00122574
  • [31] http://www.ark143.org/wordpress2/wp-content/uploads/2013/05/Tajfel-Turner-1979-An-Integrative-Theory-of-Intergroup-Conflict.pdf
  • [32] https://psycnet.apa.org/record/2004-13697-016
  • [33] https://psycnet.apa.org/record/1952-00803-001
  • [34] https://www.routledge.com/Rumors-Uses-Interpretations-and-Images/Kapferer/p/book/9781412851558
  • [35] https://psycnet.apa.org/record/1996-97682-006
  • [36] https://link.springer.com/article/10.1007/s11109-010-9112-2
  • [37] https://www.nature.com/articles/s41586-021-03344-2
  • [38] https://psycnet.apa.org/record/2019-20336-001
  • [39] https://journals.sagepub.com/doi/full/10.1177/0956797619887896
  • [40] https://firstmonday.org/article/view/7090/5653
  • [41] https://ieeexplore.ieee.org/document/6280553
  • [42] https://www.dbpia.co.kr/Journal/articleDetail?nodeId=NODE07436425
  • [43] https://elemental.medium.com/the-neuroscience-of-news-overload-9dda817f5ee5
  • [44] https://www.amazon.com/Thinking-Fast-Slow-Daniel-Kahneman/dp/0374533555

코멘트

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다