닫기

Advertisements

카카오브레인, 국내 최대 규모 이미지·텍스트 데이터셋 ‘코요’ 31일 공개

기사듣기 기사듣기중지

공유하기

닫기

  • 카카오톡

  • 페이스북

  • 트위터 엑스

URL 복사

https://www.asiatoday.co.kr/kn/view.php?key=20220830010018332

글자크기

닫기

김지혜 기자

승인 : 2022. 08. 30. 10:09

구글 검색 선호 출처 추가 Google 검색에서 아시아투데이 기사를 더 자주 볼 수 있습니다.

Advertisements

Advertisements

카카오 브렌인 로고
카카오브레인은 초거대 인공지능(AI) 연구개발 저변을 확대하기 위해 오는 31일 국내 최대 규모의 이미지·텍스트 데이터셋 '코요(Coyo)'를 공식 홈페이지에서 공개한다고 30일 밝혔다.

데이터셋은 초거대 AI 모델이 정교한 결과값을 구현하는 데 필요한 핵심 요소 중 하나다. 높은 성능을 위해 많은 기업들은 수작업으로 이미지·텍스트 쌍을 맞춰 데이터셋을 수집하는데 높은 비용과 시간이 투입된다.

카카오브레인의 코요는 약 7억4000만개의 이미지·텍스트로 이워진 데이터셋으로, 이름은 멕시코의 대표 화가 프리다 칼로의 고향인 멕시코시티 코요아칸에서 유래했다.

코요는 카카오브레인이 앞서 공개한 초거대 AI 이미지 생성 모델 'RQ-Transformer'와 AI 아티스트 '칼로(Karlo)' 개발에 적용됐다. 이중 'RQ-Transformer'는 지난 4월 공개한 뒤 기술의 우수성을 종합적으로 인정받아 6월에 열린 세계적 학술대회 CVPR 2022에서 해당 논문의 발표 기회를 얻기도 했다. 또한 최근 현대미술가 고상우, 삼성전자 '갤럭시 북 아트 프로젝트' 와의 협업을 통해 AI 아티스트 '칼로'의 활용 가능성을 입증한 바 있다.

카카오브레인은 코요를 한국어를 비롯한 다양한 언어로 개발하며 세계 최대 수준의 공개 데이터셋으로 키워나갈 계획이다. 내년 상반기에는 코요 데이터셋을 활용한 초거대 AI 모델도 추가로 공개할 예정이다.

김일두 카카오브레인 대표는 "이번 데이터셋 공개는 초거대 AI 기술 개발에 박차를 가할 중요한 근간이자 이정표가 될 것"이라면서 "앞으로도 카카오브레인은 다방면으로 기술 리더십을 선도하고 AI 커뮤니티와 협력하며 생태계 발전에 이바지할 것"이라고 말했다.

김지혜 기자

ⓒ 아시아투데이, 무단전재 및 재배포 금지

기사제보 후원하기