닫기

“검진 데이터로 미래 예측”…서울대병원-네이버 AI 개발

기사듣기 기사듣기중지

공유하기

닫기

  • 카카오톡

  • 페이스북

  • 트위터 엑스

URL 복사

https://www.asiatoday.co.kr/kn/view.php?key=20251107010003743

글자크기

닫기

강혜원 기자

승인 : 2025. 11. 07. 09:45

생물학적 나이-실제 나이 값 기준으로 분석
정상군, 질환 전단계, 질병군 간 차이 명확
“데이터로 건강상태와 미래 위험 예측 가능”
[그림2] 생물학적 나이와 실제 나이의 차이에 따른 전체 생존율 비교 (갭 기반 모델)
생물학적 나이와 실제 나이의 차이에 따른 전체 생존율 비교(갭 기반 모델) 시, 남성에서는 건강군 대비 다른 두 그룹의 생존율이 유의하게 낮았고 여성에서도 비슷한 경향이 관찰됐다./서울대병원
서울대학교병원이 네이버와 손잡고 건강검진 데이터를 활용해 개인의 생물학적 나이와 건강위험을 평가하는 인공지능(AI) 모델을 개발했다. 생물학적 나이(BA)는 유전, 생활습관 등 요인을 종합해 신체의 노화 정도를 수치화한 지표다. 실제 나이(CA)보다 생물학적 나이가 낮으면 건강 상태가 양호, 반대로 높으면 노화 촉진과 질병 위험이 높다는 의미다.

7일 조영민·배재현·윤지완 서울대병원 내분비대사내과 교수팀과 유한주·문성은 네이버 디지털 헬스케어 LAB 박사팀은 트랜스포머 기반 딥러닝 구조를 적용해 약 15만명의 검진정보와 질병·사망 데이터를 동시에 학습시켜 건강 상태를 구분하고 예측하는 AI를 개발했다고 밝혔다. 연구 결과는 디지털 헬스케어 국제학술지 'Journal of Medical Internet Research(JMIR)' 최근호에 게재됐다.

서울대병원-네이버 공동 연구팀은 2003년~2020년까지 서울대병원 강남센터에서 건강검진을 받은 151281명의 데이터를 분석했다. 신체계측, 혈액·소변검사, 폐기능 검사, 질병 유무 및 사망 정보를 기반으로 혈당·혈압·콜레스테롤(지질) 수치에 따라 △정상군 △질환 전단계군 △질환군으로 대상자를 분류했다.

연구팀은 이 데이터를 바탕으로 트랜스포머 구조의 AI 모델을 설계했다. AI는 지표들을 토대로 개인의 생물학적 나이(BA)와 실제 나이(CA)를 예측하고 두 값의 차이(BA-CA 갭)를 산출한다. 사용자의 건강 지표가 과거 생존율이 높았던 집단과 사망 위험이 높았던 집단 중 어느 쪽과 유사한지를 분석해 구체적인 예측값을 제시한다. 아울러 남녀의 생리적 차이를 반영해 성별별 모델을 각각 학습시켰다고 연구팀은 덧붙였다.

분석 결과, AI 모델은 정상군·질환 전단계군·질환군을 명확히 구분했다. 정상군은 생물학적 나이가 실제 나이보다 낮게(BA < CA), 질환군은 높게(BA > CA) 기록됐다. 혈당·혈압·지질 수치가 악화할수록 BA-CA 갭이 커졌으며, 심혈관질환이나 암이 있는 경우 갭이 유의하게 증가했다.

연구팀은 AI가 계산한 BA-CA 값을 기준으로 △건강군(BA-CA < -1) △기준군(-1≤BA-CA≤1) △비건강군(BA-CA > 1)으로 나눠 '카플란-마이어' 생존 분석을 수행했다. 그 결과 남성은 비건강군이 건강군보다 생존율이 유의하게 낮았고 여성도 유사한 결과가 확인됐다. AI가 산출한 BA-CA 값이 클수록 실제 사망 위험이 통계적으로 증가한다는 것이다.

조영민 교수는 "이번 연구는 질병 유병 상태와 사망 정보를 동시에 학습한 최초 트랜스포머 기반 생물학적 나이 예측 모델이라"이라며 "AI가 단순히 생물학적 나이를 계산하는 것을 넘어 개인의 건강 상태와 미래 위험을 함께 반영할 수 있는 새로운 임상 도구로 발전했다"고 말했다. 이어 "서울대병원의 대규모 임상 데이터와 네이버의 첨단 AI 기술력이 결합해, 의료 전문성과 기술이 함께 만든 산학 협력의 대표적 성과"라고 덧붙였다.
[사진] 서울대병원 내분비대사내과 조영민 교수
조영민 서울대병원 내분비대사내과 교수./서울대병원
강혜원 기자

ⓒ 아시아투데이, 무단전재 및 재배포 금지

기사제보 후원하기