|
지난 24일 네이버가 공개한 하이퍼클로바X는 한국어에 특화된 AI로, 50년 치 뉴스와 9년 치 블로그 내용에 달하는 데이터를 학습한 것으로 알려졌다. GPT-3.5 기반 챗GPT와 비교해 한국어를 6500배 많이 학습했다.
다만 하이퍼클로바X 역시 챗GPT 등장 이후 논란이 됐던 허위정보 생성, 지식재산권 침해 등 문제를 피해가기는 어려울 것으로 보인다. 최근 뉴욕타임스는 서비스 이용 약관에 'AI 학습에 자사 콘텐츠를 사용할 수 없다'는 내용을 추가하고 챗GPT 개발사 오픈AI에 소송을 준비 중이다. 하이퍼클로바X에 50년 치에 달하는 한국어 뉴스 데이터를 학습시켰다고 밝힌 네이버 역시 언론사들의 동의를 구하지 않아 논란이 된 바 있다.
최병호 고려대 인공지능연구소 교수는 "하이퍼클로바X와 같은 LLM 모델을 학습시킬 때 대부분 웹사이트에 있는 데이터를 다 학습시키는데, 공공의 이익과 지적재산권 보호 중 어느 것에 초점을 두느냐에 따라 해석이 달라진다"며 "만약 생성형AI를 오직 공공의 이익을 위해 개발했다고 하면 개발사 측은 상업적 이익을 취하면 안 되는데, 결국 API 서비스 등을 통해 사적 이익을 취할 것이 분명하므로 데이터 저작권자들과 수익을 나누는 등 지식재산권에 대한 적절한 보상을 제공해야 한다"고 설명했다.
전창배 국제인공지능윤리협회 이사장도 "전 세계적으로 AI 학습 데이터의 지식재산권에 관련된 법이 아직 마련되지 않은 상황이다. 기존 저작권법으로는 해결이 안 되는데, 생성형AI가 개발된 지 얼마 안 돼 아직 법을 연구하는 단계"라고 전했다.
이어 "AI 개발사가 해당 AI를 상업적으로 사용한다면 저작권 관련 문제가 성립하므로 기업이 데이터를 사용하기 전 저작권자에게 일일이 동의를 받거나 정당한 대가를 지불하고 데이터를 구입하는 방법밖엔 없다"고 말했다.
최수연 네이버 대표는 24일 개최된 'DAN 23' 컨퍼런스에서 AI 학습 뉴스 콘텐츠의 대가 지불 방식에 대해 "긴밀하게 협의해 해당 논의가 건강하게 이어져 기술회사와 콘텐츠 회사 모두 윈윈하기를 바란다"며 분명한 답변을 내놓지 않았다.
한편 네이버는 하이퍼클로바X의 한국어 능력이 뛰어나다는 점을 최대 강점으로 내세우고 있다. 다만 학계는 이것이 글로벌 AI 시장에서의 경쟁력으로 이어질지는 의문이라는 입장이다.
김형중 고려대 정보보호대학원 특임교수는 "하이퍼클로바X의 강점은 한국어 데이터가 풍부하다는 점이지만, 이것으로 글로벌 AI시장에서 성공하기는 어려운 것이 한계이자 숙명"이라며 "한국어에 특화됐다는 것은 국내 시장에서의 작은 강점일 뿐, 글로벌 시장에서는 소용없기 때문에 글로벌한 경쟁력을 갖추기 위한 또다른 준비를 해야 할 것"이라고 조언했다.
최병호 교수도 "챗GPT 등과 비교해 한국만의 문화나 정서를 반영한 것은 하이퍼클로바X의 강점이지만, 글로벌 경쟁력으로 이어지기는 힘들다"며 "세계 AI 시장으로 뻗어나가려면 국가 차원의 도움이 필요하다. 미국과 캐나다 등 국가에서는 생성형AI를 사회 인프라로 보고 국가 산업으로 여겨 엄청난 재정적 지원을 하고 있지만 한국은 오히려 예산을 줄이고 있는 상황"이라고 설명했다.














