상세 보기
해석 가능한 머신러닝을 위한 PD 플롯과 ALE 플롯의 적용: 랜덤 포레스트를 이용한 건강 관련 삶의 질 예측변수들의 효과 분석
Partial Dependence and Accumulated Local Effect Plots for Interpretable Machine Learning: A Random Forest Application to Health-Related Quality of Life
- 채희주;
- 장승민
초록
본 연구는 블랙박스 머신러닝 모형의 예측 메커니즘을 해석하기 위한 도구로서 부분 의존성(PD) 플롯과 누적 국소 효과(ALE) 플롯의 원리와 적용 방법을 소개하고 실증 분석 사례를 제시하였다. 1차원 플롯과 2차원 플롯이 각각 주효과와 상호작용효과를 어떻게 드러내는지 확인하고, 변수 간 높은 상관관계가 있을 때 PD와 ALE의 장단점을 비교하였다. 또한 ALE 기반의 정량적 효과 크기 지표와 통계적 유의성 평가 절차를 소개하였다. 국민건강영양조사 자료를 활용하여 성인의 건강 관련 삶의 질(HINT-8)을 예측하는 랜덤 포레스트 모형을 구축하고, 이 앙상블 모형에 PD 플롯과 ALE 플롯을 적용하여 복잡한 예측 메커니즘을 해석하였다. 분석 결과, 가장 중요한 예측변수인 범불안장애 점수는 건강 관련 삶의 질에 뚜렷한 부정적 영향을 보였으며, 1차원 플롯을 통해 효과 크기가 점수 증가에 따라 점차 감소하는 비선형적 양상을 확인할 수 있었다. 2차원 플롯 분석에서는 가장 큰 상호작용효과를 보인 변수 쌍의 하나인 연령과 주관적 건강 인식 간의 복잡한 이원 상호작용 패턴을 시각화할 수 있었다. 본 연구는 예측 성능이 우수한 블랙박스 모형의 해석 가능성을 높이는 실용적 방법을 제시하였다는 점에서 의의가 있다.
키워드
Interpretable machine learning; Partial dependence plot; Accumulated local effects plot; Random forest; Health-related quality of life.; 해석 가능한 머신러닝; Partial Dependence Plot; Accumulated Local Effect Plot; 건강 관련 삶의 질; 랜덤 포레스트.
- 제목
- 해석 가능한 머신러닝을 위한 PD 플롯과 ALE 플롯의 적용: 랜덤 포레스트를 이용한 건강 관련 삶의 질 예측변수들의 효과 분석
- 제목 (타언어)
- Partial Dependence and Accumulated Local Effect Plots for Interpretable Machine Learning: A Random Forest Application to Health-Related Quality of Life
- 저자
- 채희주; 장승민
- 발행일
- 2026-02
- 유형
- Y
- 권
- 28
- 호
- 1
- 페이지
- 419 ~ 436