닫기

한은, ‘뉴스 텍스트 빅데이터’ 예측모형에 반영한다…“정확도 향상 기대”

기사듣기 기사듣기중지

공유하기

닫기

  • 카카오톡

  • 페이스북

  • 트위터 엑스

URL 복사

https://www.asiatoday.co.kr/kn/view.php?key=20220516010008808

글자크기

닫기

이주형 기자

승인 : 2022. 05. 16. 12:00

clip20220516110641
뉴스 텍스트 기반 경제지표 작성 예시./제공=한국은행
최근 경기 예측과 관련해 ‘뉴스 텍스트 빅데이터’의 중요성이 대두되자 한국은행도 이를 경기 예측모형에 반영하기로 했다. 기존의 정량 지표보다 선행성을 가지고 있어 예측 정확도를 향상할 수 있기 때문이다.

한은은 16일 ‘BOK 이슈노트‘를 통해 “뉴스 텍스트를 이용해 경제지표를 작성하고 이를 정기 예측모형이 반영해 경기동향 파악과 단기 정기예측에 활용할 필요가 있다”고 밝혔다.

실물 부문에서의 고빈도 경제지표가 전무하고, 기존의 정량 지표는 한 달 이상의 공표 지연이 발생하기 때문이다. 한은은 공식 통계만으로는 정성적 정보를 예측모형에 반영하기 어려운 한계가 있다고 판단했다.

반면 뉴스 텍스트 빅데이터는 다양하고 방대한 정보를 신속하게 전달한다. 정성적 정보도 포함하고 있어 이를 정량화할 경우 예측모형의 정확도 향상에 기여할 것으로 기대했다.

이에 한은은 경제적으로 관심이 높은 생산, 고용, 물가, 주가, 주택가격 등 15개 부문을 직접 선정했다. 부문별로 대상지표를 정해 이들 지표의 흐름을 예측하는 텍스트 지표를 각각 작성했다. 이를 위해 2005년부터 2022년 3월까지 인터넷 포털사이트에 게재된 경제 분야 뉴스기사 전체를 분석했다. 기사는 연간 약 70개 언론사에서 100만건에 달한다.

텍스트 지표를 관련 공식 통계와 비교분석한 결과, 한은은 텍스트 지표가 정기 예측을 위한 중요한 정보를 내포하고 있는 것으로 평가했다. 텍스트 지표가 0~9개월 선행시점에서 공식 통계와 0.35~0.73의 상관관계를 보이고, 1~7개월 선행시점에서 유의한 그랜저 인과관계(Granger Causality, 이전 시차 독립변수들이 종속변수를 예측하는 데 통계적으로 유의미함)를 보였기 때문이다.

한은은 분기 국내총생산(GDP) 예측모형에도 뉴스 텍스트 지표를 활용한 결과, 예측 정확도가 유의미하게 향상됐다고 밝혔다.

한은 관계자는 “텍스트 지표는 조사 대상 기준일에 즉시 작성할 수 있어 입수시점이 빠르다”며 “전문가 전망 등을 반영해 선행성을 갖는 점으로 미뤄 GDP 예측력 향상에 기여하는 것으로 판단된다”고 설명했다.

이어 “정성적 방법으로 뉴스를 이용하는 것에 비해 ’휴먼 에러‘를 줄이는 데에도 기여할 것으로 기대된다”고 덧붙였다.


이주형 기자

ⓒ 아시아투데이, 무단전재 및 재배포 금지

기사제보 후원하기