|
숭실대는 전자정보공학부 권민혜 교수 연구팀 논문 'Personalized Split Federated Learning with Early-exit: Pre-training and Online Learning Against Label Shifts'가 IEEE Internet of Things Journal에 게재됐다고 21일 밝혔다.
IEEE Internet of Things Journal은 미국 전기전자공학회(IEEE)가 발행하는 사물인터넷(IoT) 분야 국제저명학술지다.
권 교수 연구팀은 데이터를 외부로 내보내지 않고 스스로 학습하며 변화에 적응할 수 있는 인공지능(AI) 기술을 개발했다.
기존 AI 시스템은 모델 학습을 위해 데이터를 중앙 서버에 모아야 해 개인정보 유출과 통신비용 증가, 기기 성능 제약 등의 단점을 가지고 있었다. 권 교수 연구팀은 서버가 정답 데이터(라벨)를 직접 받지 않아도 학습이 가능한 '대리 타깃' 생성 기법을 활용, 각 IoT 기기가 자체 데이터를 기반으로 모델 일부를 독립적으로 학습하고 서버에는 암호화된 손실값만 전송하는 방식을 고안했다. 이를 통해 각 IoT 기기가 원본 데이터를 공유하지 않고도 협력적으로 학습할 수 있는 개인화 연합학습 구조를 제시했다.
그 결과 데이터는 한 번도 외부로 유출되지 않으면서 서버와 다수의 기기가 협력해 하나의 고성능 AI를 공동 학습할 수 있게 됐다. 이번 연구는 기존 연합학습의 주요 취약점이던 라벨 공유에 따른 프라이버시 침해 문제를 근본적으로 차단해 개인정보 유출 위험을 최소화하면서도 학습 효율성과 정확도를 높였다. 이로써 학습 효율을 유지하면서도 데이터 보안성이 강화됐으며, 통신량은 절반 이하로 줄었다.
연구팀은 또 '온라인 적응 학습' 구조도 도입해 환경 변화가 실시간으로 발생하는 상황에서도 안정적인 성능을 유지하도록 설계했다. 기존의 정적 학습 모델은 변하는 환경을 반영하지 못해 성능이 떨어지는 한계가 있었다. 연구팀은 AI가 학습 패턴을 스스로 조정하는 온라인 학습과 서버의 대형 모델이 각 기기에 지식을 전달하는 지식증류 방식을 결합해 이런 문제를 해소했다. 이를 통해 각 기기는 별도의 서버 연결 없이 스스로 수집한 데이터를 기반으로 모델을 실시간 보정하면서 전체 시스템의 지식을 공유할 수 있게 됐다.
연구팀은 아울러 '얼리-엑시트' 구조를 도입해 서버 도움 없이도 빠르게 결과를 예측할 수 있게 했다. 시뮬레이션 결과 제안된 기술은 기존 연합학습이나 스플릿러닝 방식에 비해 평균 18.5% 높은 정확도를 보였고, 데이터 분포가 변화하는 상황에서는 최대 30.9%까지 성능이 올라갔다. 통신량도 약 40~60% 감소해 학습 속도와 안정성이 대폭 높아졌다.
이번 연구는 정보통신기획평가원(IITP)의 '분산·협력 AI 기반 5G+ 네트워크 데이터 분석 기능 및 제어 기술 개발' 과제의 지원으로 수행됐다.














