• 아시아투데이 로고
“스타트업, AI 데이터 수집·레이블링에 어려움 있어”

“스타트업, AI 데이터 수집·레이블링에 어려움 있어”

기사승인 2020. 04. 21. 14:20
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
  • 카카오톡 링크
  • 주소복사
  • 기사듣기실행 기사듣기중지
  • 글자사이즈
  • 기사프린트
[사진 1] 구글플레이 개발자와의 대화 #13
구글플레이는 21일 구글 미트(Google Meet)로 ‘2020년 소비자 트렌드-초개인화 기술’을 주제로 한 ‘구글플레이 개발자와의 대화’를 열었다. 사진은 이날 행사에 (왼쪽 상단부터)이수지 디플리 대표·황리건 원티드랩 제품총괄·정원국 매스프레소 CTO 등이 참석한 모습./제공=구글플레이
스타트업이 인공지능(AI) 데이터 수집과 레이블링(선별)에 있어 어려움을 호소했다.

구글플레이는 21일 구글 미트(Google Meet)로 ‘2020년 소비자 트렌드-초개인화 기술’을 주제로 한 ‘구글플레이 개발자와의 대화’를 열었다. 이날 행사에 참여한 △디플리 ‘와(WAAH, AI 아기 울음소리 분석 서비스)’ △원티드랩 ‘원티드(AI 채용 서비스)’ △매스프레소 ‘콴다(AI 수학 풀이 검색 서비스)’ 등 AI 스타트업 3개사는 AI 데이터 수집과 레이블링에 어려움을 겪고 있다며 입을 모았다.

이수지 디플리 대표는 “1년 반이 넘는 시간 동안 7만 시간이라는 데이터를 직접 모았다. 데이터 수집과 동시에 각 데이터가 어떤 정보인지, 특성을 갖는지 레이블링을 해야 하는데 직원 모두가 하루 종일 아기 울음 소리를 듣고 체크하는 과정을 했다”며 “시간 지나서는 아르바이트생 10~20명 정도를 고용해서 아기들 울음소리 구간 체크를 했다. 이걸 우리는 레이블링 공장이라고 불렀는데, 상당히 노동량이 많은 분야다. 여기에 많은 노력을 할애 중이다”고 밝혔다.

황리건 원티드랩 제품총괄은 “스타트업이 방대한 데이터를 가지고 AI를 하기가 쉽지 않다. 창업한 지 얼마 안 된 스타트업이 데이터를 쌓는 게 힘든데 향후 이에 대한 인프라가 잘 돼 있어서 활용할 수 있었으면 좋겠다”며 “지원이 더 있다면 좋아질 거 같다”고 말했다.

정원국 매스프레소 CTO는 “레이블링에 상당한 고통을 겪고 있다”며 “수학 문제를 사진으로 촬영하는 서비스이다보니 OCR 인식 시 결과에 따른 노이즈와 수학문제를 어떻게 레이블링할지 두 가지 문제를 해결해야 한다”고 덧붙였다.

이날 이들은 코로나19로 인한 영향은 거의 없다고 분석했다. 원티드랩은 수시·경력직 채용 중심 서비스이기 때문에 큰 영향은 없다는 설명이다. 황 제품총괄은 “다만 장기적으로 코로나19가 확대됐을 때, 영향이 있을지 예의 주시 중이다”고 덧붙였다.

디플리 측은 홈 서비스이기 때문에 오히려 증가하는 양상을 보였다고 설명했다. 이 대표는 “사용자 측면에서 조금 증가했다고 내부적으로 판단했다”며 “다만 외부 기업 협업은 상당히 영향을 받아 프로젝트는 연기됐다”고 말했다.

정 CTO는 “매스프레소는 아직 사용량이나 사용자수에서 감소는 없다”며 “인도네시아 시장의 경우 코로나19 사태 이후 갑자기 온라인으로 유입되는 수가 3배 이상 증가했다. 온라인 개학 등 특수한 상황에 영향이 있다고 본다”고 분석했다.

한편, 디플리는 사운드 기반 AI 스타트업으로, AI 기반 아기 울음 분석 앱 ‘와’를 개발했다. 와는 아기가 내는 소리를 다양한 센서로 감지하고 의미를 분석하는 서비스를 제공하며, 약 7만 시간에 이르는 0~6개월 사이의 신생아 소리를 모아 감지 및 상황인지 기술을 기반으로 아기 울음소리를 분석한다. 향후 디플리는 생활 소음 등을 분석해 AI 스피커 등과 연계한 보편적 서비스 플랫폼화가 되는 것을 목표로 했다.

원티드랩은 2015년 설립한 지인 추천 채용 서비스 스타트업으로, 총 217억원의 누적 투자 유치에 성공했다. 원티드랩의 채용 플랫폼 ‘원티드’는 현재 약 7000여개 글로벌 기업이 이용 중이며 일본·대만·홍콩·싱가포르 등 5개 국가에서 서비스하고 있다. 황 제품총괄은 “구인구직을 넘어 구직 중일 때 교육 콘텐츠를 추천하는 등 성장 기회이자 행복할 수 있는 콘텐츠를 제공하려고 한다”며 “사람을 AI가 어떻게 평가하냐는 우려도 있지만, AI가 채용 담당자 대신이 아닌 객관적이고 공정한 평가를 도와주는 도구로서 자리하게 할 것”이라고 밝혔다.

매스프레소는 AI 수학 풀이 검색 서비스 ‘콴다’를 운영하고 있다. AI 기반 OCR(광학문자인식) 기술을 개발했으며, 누적 5억 건 이상의 데이터를 구축했다. 콴다는 풀이검색·일대일(1:1) 질문답변·수식 계산기·문제집 서비스·개념 검색 등 서비스를 제공 중이다. 현재 누적 다운로드 700만건, 40만명 이상 일간 활성 사용자를 보유하고 있고, 해결 문제 수는 5억 건에 달한다. 매스프레소는 현재 풀이검색 서비스를 고도화 중으로 향후 맞춤형 콘텐츠 제공을 목표로 한다.


ⓒ아시아투데이, 무단전재 및 재배포 금지


댓글