• 아시아투데이 로고
[기고] 데이터 분석 기회가 더 많은 사람들에게 제공될 수 있기를 바라며

[기고] 데이터 분석 기회가 더 많은 사람들에게 제공될 수 있기를 바라며

기사승인 2021. 11. 18. 15:17
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
  • 카카오톡 링크
  • 주소복사
  • 기사듣기실행 기사듣기중지
  • 글자사이즈
  • 기사프린트
KakaoTalk_20211118_130559973
손우식 국가수리과학연구소 감염병연구팀장
필자는 수리과학을 이용하여 감염병의 확산을 예측하고 방역 정책들의 감염 확산 억제 효과를 분석하는 연구자다. 감염병의 확산은 사람들의 일상생활과 깊은 관련을 갖고 있다. 특히 호흡기 감염병은 가구, 직장, 학교, 종교 시설, 친목 모임 등의 밀접 접촉을 통해서 전파되므로 사람들의 거주 지역, 가구원, 직장 및 학교, 종교 관련 데이터를 확보하고 이를 활용할 수 있다면 감염병 확산 예측에 도움이 될 수 있다. 하지만 영화 ‘트루먼 쇼’와 같이 한 개인의 일상을 모두 기록할 수 있는 게 아니라면 각 개인 차원에서 세세한 위의 데이터를 모두 기록할 수도, 한 곳에 모으는 것도 불가능하다.

그렇지만 개인정보 보호 지침을 지키면서 해상도를 낮추어서 각 개인 차원이 아닌 지역, 연령, 시간대 별로 사람들의 일상생활과 관련된 데이터를 정리하는 것은 가능하며 공공기관과 민간기업이 보유한 데이터를 이 목적으로 이용할 수 있다. 한국데이터산업진흥원에서 운영하는 데이터안심구역은 공공기관과 민간기업이 보유한 데이터 중 개인정보 보호 지침을 지키면서 정리된 유용한 데이터들을 한 곳에 모아서 수요자들에게 데이터 분석 환경을 제공하는 공간이다. 자료 제공 기관에게는 개인정보 보호 및 제공한 데이터가 오용될 수 있는 것을 방지하고, 데이터 분석 수요자들에게는 공공기관 및 민간기업의 데이터를 함께 이용할 수 있다는 가능성을 주는 공간이다.

코로나19 대유행 이후 필자는 코로나19 국내 지역별 확산 및 해외 유입 예측에 대한 연구를 하고 있었는데 이를 위해 휴대폰 데이터 분석이 필요했고 데이터안심구역이 확보한 휴대폰 기지국 데이터를 활용할 수 있었다. 데이터안심구역의 데이터 분석환경은 매우 만족스러웠다. 특히 확보한 데이터에 대한 상세한 설명을 분석환경 시스템에서 바로 확인할 수 있었던 점 그리고 R, Python등의 데이터 관련 오픈소스 라이브러리가 매우 잘 구축돼 있던 점에 높은 점수를 주고 싶다. 앞으로 데이터 안심구역이 다루는 데이터 종류와 양도 확대되고, 또한 데이터 안심구역이 전국 곳곳에 설치되어 많은 사람들에게 가치 있는 데이터 분석의 기회가 제공될 수 있기를 바란다.


ⓒ아시아투데이, 무단전재 및 재배포 금지


댓글
기사 의견쓰기