|
20일 김일두 카카오브레인 대표는 기자간담회에서 “글로벌 최대 규모의 이미지 텍스트 멀티모달 데이터셋을 구축하고 모델과 함께 공개할 계획”이라고 말했다.
그는 “구글의 경우 18억건의 데이터셋을 구축했고, 오픈AI의 경우 10억건을 만들었다”며 “카카오브레인의 경우 20억건의 데이터셋을 구축했고 이미지와 텍스트를 동시에 이해할 수 있는 모델을 내년 1월 일부 공개할 것”이라고 덧붙였다.
멀티모달은 텍스트와 이미지 학습을 넘나드는 AI 모델로 텍스트, 이미지, 영상 등 다양한 영역을 AI가 동시에 이해하고 복합적인 결과물을 도출할 수 있다.
최근 카카오는 오픈 미니 컨퍼런스를 개최하고 카카오의 두 번째 초거대 AI 모델인 ‘민달리(minDALL-E)’를 공개했다.
김 대표는 “이번주에 공개한 AI 모델은 추론과 상상의 영역에 도전했다는 점에서 남다른 의미가 있다”라며 “향후 2~3년, 길게는 5년 간 AI는 인간의 추론 능력과 유사한 형태로 발전할 것”이라고 설명했다.
카카오브레인은 자사의 AI를 ‘교육’과 ‘헬스케어’ 분야에 적용하겠다는 계획도 밝혔다.
김 대표는 “초거대 AI는 디지털 휴먼을 완성해나가는 기반 기술”이라며 “사람과 같은 AI는 결국 사람이 하는 역할을 대체하게 되는데, 인간이 할 수 있는 가장 고부가가치의 영역을 따져봤을 때 헬스케어와 교육분야라고 봤다”고 말했다.
이어 그는 “카카오브레인은 차별화된 연구 기술을 선도해가면서 이 기술들이 세상에 중요한 문제에 쓰여지게 할 것”이라며 “20억건 수준의 이미지-텍스트 데이터를 기반으로 사람 같은 AI를 실현할 수 있도록 연구하고 있고, 이를 일부 공개해 AI 산업 전반에 기여할 수 있는 방안도 검토 중”이라고 말했다.














