국가 AI 전략, 정부가 명확한 가이드 내놔야
|
|
경연이 무르익자 각 사 기술에 대한 실체가 드러나고 결국 자격과 기준에 대한 논란에 불이 붙었다. 바로 프롬 스크래치(From Scratch) 여부. 스포츠 경기의 출발선을 의미하는 이 표현은 아무 기반도 없이 출발선에서부터 새로 만든 AI 모델인지를 가르는 표현이다.
최근 사이오닉 AI 대표가 업스테이지의 프롬 스크래치 여부에 대해 의혹을 SNS에 게재하며 이 논란에 첫 불을 지폈다. 김성훈 업스테이지 대표는 즉각 공개 검증회를 통해 학습 로그, 체크포인트, Wandb(실험 기록) 등을 전체 공개하며 강경 대응했고, 끝내 논란을 불식시켰다. 데이터에 기반해 객관적인 근거를 투명하게 제시한 것이다. 이를 누구나 볼 수 있게 유튜브를 통해 생중계했고 참석자들의 질문도 받았다. 바로 다음 날 공개 검증을 했다는건 준비할 필요가 없었다는 뜻이다. 있는 그대로 공개하고 결국 의혹을 제기한 작성자의 사과를 받아냈다.
이에 대해 배경훈 부총리도, 하정우 수석도 SNS를 통해 국가대표 AI프로젝트를 통해 건강한 생태계가 조성되고 있다는 방증이라며 응원했다. 검증을 통해 의혹이 사실이 아님을 증명해 낸 업스테이지, 그리고 이를 인정하고 쿨하게 사과한 사이오닉 대표에 대해서도 멋지다고 했다.
문제는 이후 불거진 네이버의 프롬 스크래치 논란이다. 중국 큐웬의 인코더를 채택한 것을 인정했지만, 이는 중요한 게 아니라는 게 회사측 설명이다. 공식 해명에 "이번 모델에서는 글로벌 기술 생태계와의 호환성 및 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"고 했다.
하지만 업계에서의 반응은 차갑다. 이에 따르면 네이버가 인코더의 역할을 축소하고 있지만 인코더는 네이버 모델의 핵심 모듈이다. 가중치가 중국 큐웬 모델과 같다는 것은 중국 모델을 그대로 가져다 쓴 수준으로 의존했다는 것이다. 모델 전체가 의존도 있게 학습된 것이라 바꿀 수도 없다.
국가대표라는 말에 어울리는 운동선수로 예를 들자. 도핑 의혹이 있다면 직접 모든 걸 공개하고 증명하면 된다. 업스테이지는 했고 네이버는 디테일을 말하지 않고 시간을 벌고 있다. 경기가 끝난 후 따져보는 걸론 의미가 없다.
네이버는 "모든 기술을 바닥부터 새로 만드는 것만이 능사는 아니라고 생각한다"고 했고 "AI 기술 개발은 이미 검증된 글로벌 빅테크의 '거인의 어깨' 위에서, 우리만의 고유한 가치를 한 스푼 더해 발전해 나가는 과정"이라고 했다.
정부가 말한 국가 AI전략이 정말 그랬나. 경연의 취지와 맞나. 네이버의 설명은 가볍게 볼 부분이 아닌 국가 기술 주권, 연구 윤리, 그리고 산업 신뢰를 가르는 정치적 선언으로 봐야 하는 게 아니냐는 게 업계 평가다. 일각에선 회사의 마케팅이 국가 AI 전략을 망가뜨리고 있다는 비판도 나온다.
국가대표AI 모델은 앞으로 공공, 국방, 금융 등 나라의 근간에서 중요한 역할을 맡게 된다. 그런 모델의 핵심이 외산 특히 보안을 장담할 수 없는 중국산이라면 이건 경쟁력의 문제가 아니라 국가 경제, 안보에 심각한 위협이 될 가능성이 높다.
무엇을 기준으로 '국산 AI'라 할 수 있나. 막대한 예산과 AI자원은 어떤 기술에 투입되고 있나. 독자성 검증은 누가, 어떻게 하나.
정부가 답해야 할 차례다. 이번 프로젝트의 이름이 왜 '독자' 파운데이션 모델 프로젝트인지. 자격과 조건이 무엇인지를 명확히 해야 국가대표 AI 전략이 오염되지 않을 수 있다.















