• 아시아투데이 로고
[특별 기고] 챗GPT 시대, 데이터 편향성 악화시키는 네이버

[특별 기고] 챗GPT 시대, 데이터 편향성 악화시키는 네이버

기사승인 2023. 02. 17. 07:00
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오톡 링크
  • 주소복사
  • 기사듣기실행 기사듣기중지
  • 글자사이즈
  • 기사프린트
박재형 재미 정치학박사·'AI는 중립적인가' 저자
챗GPT 열풍...AI 중립, 환상...데이터, 정치적
AI 알고리즘, 집단 성향·선호·가치 반영
네이버, 뉴스 데이터 노출 통제
박재형
박재형 재미 정치학박사
한국뿐 아니라 세계적으로 인공지능 챗봇 챗(Chat)GPT에 대한 관심이 뜨겁다. 거대한 규모의 데이터를 기반으로 다양한 콘텐츠를 생성해 이용자가 원하는 정보를 제공하는 '오픈AI'의 '생성형 인공지능'기술이 당장 세상을 완전히 바꿀 것이라며 열광한다. 혁신 기술의 선점을 위한 미국 등 각국의 기술 대기업들의 경쟁도 열기를 더해간다.

이 과정에서 구글(Google)이 챗GPT와 경쟁할 기술을 시연하는 행사에서 틀린 답을 내놓아 회사 주가가 폭락하는 일이 있었다. 경쟁사 마이크로소프트(MS) 또한 새로운 검색엔진 시연에서 틀린 수치를 제시하는 문제가 드러났다. 이를 통해 인공지능(AI) 기술, 그중에서도 인공지능을 이용한 검색과 정보 제공 기술 앞에 놓인 도전 과제를 다시 생각해 보게 된다. 특히 한국인의 온라인 이용에 독점적 영향력을 가지고 있는 네이버의 행태와 관련해서는 우려가 더욱 커진다.

요즘 세상은 이전보다 이용할 수 있는 정보량이 엄청나게 많아지고 정보 처리 속도 역시 비교 못 할 만큼 빨라졌다. 그렇다면, 대중의 정치 사회 현상에 대한 인식이 훨씬 넓어지고, 그 수준이 높아져야 하지 않을까? 그런데 반대로 가는 것은 왜일까? 기술이 발달할수록 사람들의 정치의식은 더 편협해지고 폐쇄적으로 되는 이유는 무엇일까? 문제의 중심에 그 시스템을 움직이는 핵심 기술, 그중에서도 데이터를 기반으로 하는 인공지능 기술이 있다.

여기서 한 가지 중요한 질문을 하게 된다. 4차 산업혁명의 핵심이라고 하는 인공지능 기술, 이 인공지능이 정치적으로 또 사회·문화·윤리적으로 중립적이며 사람이 아닌 기계인 만큼 어느 한쪽의 이익을 우선하지 않는 존재일까? 과연 인공지능은 중립적일까?

빅데이터와 인공지능이 제공한 정보라고 하면 정치적·정파적 이해관계에 의한 것이라기보다 중립적이고 공정해서 믿을 수 있다는 생각들을 한다. 아무리 정치가 오염되었어도 과학기술은 순수하고 공정하고 믿을 수 있다는 인식이 보편적이기 때문이다. 그러나 과학기술은 뭔가 순수하고 공정하고 믿을 수 있다거나 어느 한쪽에 치우치지 않고 중립적일 것이라는 막연한 믿음은 환상이나 착각일 뿐이다.

인공지능을 이용해 데이터를 분석하고 학습해서 결정하도록 하는 대부분의 일은, 정도의 차이는 있지만 간접적으로 정치와 연관되어 있고 정치에 영향을 미칠 수밖에 없다. 인공지능과 데이터에 대한 가장 큰 오해는, 인간이 편향적이고 비이성적이며 감정적이기 때문에 인공지능의 알고리즘을 '과학적'인 것으로 받아들여야 하며, 따라서 문화적 규범을 이유로 변형되어서는 안 된다는 것이다.

그러나 인공지능을 누가 작동하고 운영하느냐, 즉 그 알고리즘을 누가 만들고 관리하느냐에 따라 인공지능은 크고 작은 정치적 또는 사회적·문화적 편향성을 가질 수밖에 없다. 인공지능은 알고리즘을 설계하고 관리하는 사람 또는 집단의 성향·선호·가치 등의 요소가 처음부터 그 알고리즘에 반영될 가능성이 상당히 크다.

일례로 아마존은 몇 년 전 직원 채용 과정에 처음으로 인공지능을 도입했다. 하지만 인공지능이 남성 지원자를 선호하는 경향이 확인되어서 결국 인공지능에 의한 채용을 중단했다.

인공지능의 알고리즘을 설계할 때 그 설계자의 성향과 가치판단이 처음부터 포함되었기 때문에 생긴 일이다. 인공지능의 작동 바탕인 데이터 역시 같은 맥락에서 이해할 수 있다.

데이터는 인터넷에 연결된 모든 사람과 관련 있을 뿐만 아니라 국가와 시민 간의 관계를 재구성한다. 이에 따라 사회적·정치적 문제를 일으킬 수 있다. 이제 거의 모든 기기가 인터넷에 연결되어 사용자의 인지 여부와 관계없이 상호작용이나 거래 및 이동 등에 관한 방대한 양의 디지털 흔적을 만든다.

데이터에는 큰 결점이 있다. 데이터는 중립적이지 않다. 데이터는 본질적으로 정치적이다. 무엇을 수집하고, 무엇을 무시할지는 정치적 선택에 따른 행위이다. 따라서 데이터는 단순히 사회를 그대로 반영하는 것이 아니다. 데이터를 코딩하는 과정에서 권력 구조를 개인 삶의 구석구석에 접목한다. 이렇게 함으로써 데이터는 개인을 위해 결정을 내리고, 개인의 삶을 형성하며, 개인이 볼 수 있는 것과 볼 수 없는 것을 정해준다.

이러한 현실은 한국인의 디지털 뉴스 소비 생활 대부분을 차지하고 있는 네이버를 통해 확인할 수 있다. 네이버는 국내 언론사들을 4단계로 등급화해 이용자에 대한 뉴스 데이터의 노출을 통제한다는 비판이 제기되고 있다. 즉 개인이 볼 수 있는 뉴스와 볼 수 없는 뉴스를 네이버가 정해준다는 것이다. 그러나 이용자는 자신이 보는 뉴스가 정치적으로 중립적인 인공지능 알고리즘에 의해 제공된다는 막연한 환상 속에 살고 있다.
후원하기 기사제보

ⓒ아시아투데이, 무단전재 및 재배포 금지


댓글