로앤컴퍼니 ‘빅케이스GPT’…변호사시험 절반 이상 맞혔다

읽기모드

글자크기

기사듣기

인쇄하기

URL 복사

https://www.asiatoday.co.kr/kn/view.php?key=20231018010008762

글자크기

김채연 기자

승인 : 2023. 10. 18. 09:40

빅케이스GPT, 생성형 AI 최대 한계 할루네이션 '제로'에 가까워
로앤컴퍼니 "내년 상반기 중 AI 기반 변호사향 서비스 출시 예정"

	clip20231018091651	0
빅케이스GPT 변호사시험 정답률 GPT-4 대비 56.8% 개선/로앤컴퍼니

로앤컴퍼니가 제12회 대한민국 변호사시험 객관식 문제에서 53.3%의 정답률을 달성한 '빅케이스GPT'의 성과를 18일 발표했다. 이는 현존하는 최고 성능의 언어 모델로 인정받는 GPT-4 정답률 34%를 56.8%(19.3%p↑) 개선한 결과다.

'빅케이스GPT'는 AI 기반 통합 법률정보 서비스인 빅케이스와 법률 종합 포털 로톡의 운영사인 로앤컴퍼니가 만든 자체 AI 시스템이다. 앞서 로앤컴퍼니는 지난 3월 오픈AI의 최신형 언어 모델인 GPT-3.5와 GPT-4를 활용해 변호사시험 객관식 문항을 풀도록 하는 자체 실험을 실시했고 각각 28.7%와 34%의 정답률이 나오는 것을 확인했다.

변호사시험 객관식 문항은 공법 40문항, 민사법 70문항, 형사법 40문항 등 총 150문항으로 구성된다. 빅케이스GPT는 이 문항들 중 각 19개, 40개, 21개 등 총 80개의 정답을 맞혔다.

로앤컴퍼니는 빅케이스GPT에 판례뿐 아니라 빅케이스가 보유한 법령 14만 5000건, 결정례 7000건, 유권해석 7000건 등 총 16만건의 법률정보도 추가로 학습시켰다. 로앤컴퍼니는 "특히 빅케이스GPT는 생성형 AI의 최대 한계점으로 꼽히고 있는 할루시네이션(환각, 정보 왜곡 현상)을 '제로'에 가깝게 통제해 데이터의 신뢰성을 대폭 강화한 것이 특징"이라며 "반복적인 테스트를 통해 빅케이스GPT가 가짜 판례나 법령을 제시하지 않는 수준에 이른 것에 대한 검증을 마쳤으며, 향후 지속적인 QA를 거쳐 이를 완벽하게 제거할 예정"이라고 밝혔다.

이어 "향후 빅케이스GPT에 다수의 언어 모델을 실험·적용하고 자체적으로 개발한 최적의 언어 모델을 추가로 적용해 본 시스템을 고도화할 계획이고, 이를 통해 내년 상반기 중 '슈퍼로이어(Super Lawyer, 가칭)'라는 AI 기반의 변호사향 B2B SaaS 서비스를 신규 출시하려고 한다"며 "법률 메모 생성·법률서면 요약·법률 질의응답 등의 기능을 제공해 변호사의 업무 효율 제고에 기여하는 것이 목표"라고 덧붙였다.

김본환 로앤컴퍼니 대표는 "한국어와 대한민국 법률에 최적화된 언어 모델로 개발될 슈퍼로이어는 변호사를 돕는 'AI 법률 비서'와 같이 구동되며 변호사의 업무효율을 극대화하는 역할을 맡게될 것"이라며 "법률AI연구소를 중심으로 변호사님들의 성과를 높이기 위한 서비스 출시에 집중해 더 많은 변호사님들의 업무환경 개선에 도움을 드리고 싶다"고 전했다.

김채연 기자dksgh06@naver.com