로고

로고

Research

연구 정보

Research Project (승인과제목록)

KNN 연구 요약서

Title A machine learning model for predicting neonatal resuscitation needs in Very L ow Birth Weight Infants: a Nationwide Neonatal Network
Author 김현호
작성자 김현호
Background 빅데이터를 분석할 수 있는 기술이 발달함에 따라 다양한 분야에서 머신러닝(Machine learning)과 딥러닝(Deep learning)과 같은 인공지능(AI)을 이용한 분석과 활용이 증가하였다. 최근, 의학연구분야에서도 기존의 빅데이터를 활용한 AI 분석이 시도되고 있다. 머신러닝 알고리즘은 이해하기가 쉽고 정형화된 형태로 제공되며, 특히 파이썬 (Python) 프로그래밍에서는 쉽게 따라할 수 있는 패키지 형태로 제공이 되어 분석과 해석이 용이하다. 신생아는 출생 후 자궁외 환경에 적응하는 이행의 과정을 거치게 된다. 신생아의 10% 정도에서는 초기 처치, 산소 공급, 양압환기, 기도삽관, 가슴압박, 에피네프린 투여 등의 치료가 필요하다. 하지만 1500g 미만의 미숙아에서는 대부분 신생아 소생술이 필요하다. 기존에 연구에서는 2013-2015년도의 데이터를 이용하여 로지스틱 회귀분석을 이용한 예측 모델을 구축하였으며, 그 이후 추가적인 연구는 진행되지 않아 관련 내용에 대한 분석과 연구가 필요한 상태이다.
Aim / Hypothesis 이번 연구에서는 머신러닝 알고리즘을 이용하여 극소저체중출생아가 출생 직후 신생아 소생술이 필요한 단계를 예측하는 모델을 만들고자 한다.
Inclusion Criteria 극소저체중출생아로 출생하여 한국 신생아 네트워크에 등록된 환자
Exclusion Criteria 선천성 기형을 진단받은 환자
Study Design Statistical methods 1) 결과 변수 정의 및 입력 변수 선택 - Output target variable Primary – 출생 후 적용된 신생아 소생술 단계 (산소투여, 양압환기, 기도삽관, 가슴압박, 소생을 위한 약물 사용) Secondary – 출생 후 3일 이내 사망 -Input features: Baseline eCRF 항목 중 분만실 직전까지 획득 가능한 정보 2) 데이터 전처리 데이터 구분(Splitting): 훈련 세트(80%)와 테스트 세트(20%)로 구분한다. 3) 머신러닝 알고리즘에 적용 - Training and validation: Stratified Cross-validation with AUROC -Hyperparameter optimization: Grid Search with AUROC 4) 머신러닝 알고리즘에 적용 - Logistic Regression, Decision tree, Linear Support Vector Machine - Random Forest, Extra Trees - Extreme greatest boost (XGB), Light GBM 5) 예측 모형을 테스트 세트에 적용하여 평가 - AUROC, AUPRC, F-score, Accuracy, Feature importance
Primary Outcomes 출생 직후 적용된 신생아 소생술 단계
Secondary Outcomes and Definitions 출생 후 3일 이내 사망
Protocols 1. 예측 모델의 평가 - AUROC, AUPRC, Accuracy, F-score, Feature importance 2. 모델 변수 중요도 비교 - 머신러닝 알고리즘의 Rank of importance of variable 등
Funding no