이달 말부터 국과수 수사 과정서 적극 활용 예정
|
행정안전부 통합데이터분석센터는 국립과학수사연구원(국과수)과 함께 지난해부터 보이스피싱 범죄자 검거에 초점을 두고 화자 구분 정확도를 높이고 범죄연루자 그룹화가 가능한 '음성분석 모델' 개발을 완료했다고 22일 밝혔다.
경찰청 자료에 따르면 지난 5년간 국내에서 발생한 보이스피싱 피해 건수는 총 15만 6249건, 피해액은 3조 원을 넘어서는 등 국민 피해가 막심했다.
종전에는 국과수가 보이스피싱 수사를 할 때 러시아와 영국이 개발한 음성분석 모델을 활용해 음성감정을 진행해야 했는데, 외국어로 학습된 음성분석 모델 특성상 인식률이 떨어지는 한계가 있었다. 최신 인공지능학습(AI 딥러닝) 기술을 적용한 이번 모델은 개발과정에서 국내외 약 6000여 명으로부터 추출한 100만 개 이상의 외국어와 한국어 음성데이터가 활용됐다고 행안부는 설명했다.
특히 한국어의 경우, 약 10만 개 이상의 일반인 음성데이터와 국과수가 보유 중인 실제 보이스피싱 사기범 음성데이터를 함께 사용해 다양한 학습 과정과 성능 검증과정을 반복 시행함으로써 정확도를 높였다. 100개의 범죄자 음성 감정시 기존모델에서는 목소리 동일성 여부를 28개 정도만 판별해 낼 수 있었지만 새로운 모델에서는 51개까지 판별이 가능해졌다. 성능 검증결과, 범죄자의 음성을 정확하게 판별해내는 판독률이 기존 외산 분석모델 대비 약 77% 향상된 것이 확인됐다.
이어 기존 모델에서는 기대할 수 없었던 범죄가담자 그룹화 기능도 세계 최초로 구현할 수 있게 됐다. 국과수는 보유하고 있는 약 1만 개의 보이스피싱범 음성데이터를 분석해 범죄조직 그룹화와 이미 검거된 범죄자의 여죄 추궁 등에 사용할 방침이다. 아울러 경찰청과도 모델을 공유해 보이스피싱 범죄 초동수사의 속도와 검거율을 높이는데 활용하고 기관사칭, 전세사기 등 다양한 음성관련 범죄 수사 전반에 적용한다.
정부는 이 같은 최신 음성 과학수사 기법을 새로운 '행정한류 상품'으로 개도국에도 확산할 방침이다. 보이스피싱범의 음성은 금융감독원 누리집(보이스피싱지킴이)에도 공개해 보이스피싱 범죄에 대한 경각심도 높인다.
한창섭 행안부 차관은 "이번에 새로 개발된 음성분석 모델은 데이터 분석을 통해 사회현안을 해결하는 디지털플랫폼정부의 구체적 성과물"이라며 "앞으로도 데이터기반의 일 잘하는 정부구현을 위해 국민이 필요로 하는 분석과제를 발굴하고, 분석된 결과를 현장에 적극 활용해 나갈 것"이라고 말했다.










