해석 가능한 머신러닝을 위한 PD 플롯과 ALE 플롯의 적용: 랜덤 포레스트를 이용한 건강 관련 삶의 질 예측변수들의 효과 분석

Partial Dependence and Accumulated Local Effect Plots for Interpretable Machine Learning: A Random Forest Application to Health-Related Quality of Life

초록

본 연구는 블랙박스 머신러닝 모형의 예측 메커니즘을 해석하기 위한 도구로서 부분 의존성(PD) 플롯과 누적 국소 효과(ALE) 플롯의 원리와 적용 방법을 소개하고 실증 분석 사례를 제시하였다. 1차원 플롯과 2차원 플롯이 각각 주효과와 상호작용효과를 어떻게 드러내는지 확인하고, 변수 간 높은 상관관계가 있을 때 PD와 ALE의 장단점을 비교하였다. 또한 ALE 기반의 정량적 효과 크기 지표와 통계적 유의성 평가 절차를 소개하였다. 국민건강영양조사 자료를 활용하여 성인의 건강 관련 삶의 질(HINT-8)을 예측하는 랜덤 포레스트 모형을 구축하고, 이 앙상블 모형에 PD 플롯과 ALE 플롯을 적용하여 복잡한 예측 메커니즘을 해석하였다. 분석 결과, 가장 중요한 예측변수인 범불안장애 점수는 건강 관련 삶의 질에 뚜렷한 부정적 영향을 보였으며, 1차원 플롯을 통해 효과 크기가 점수 증가에 따라 점차 감소하는 비선형적 양상을 확인할 수 있었다. 2차원 플롯 분석에서는 가장 큰 상호작용효과를 보인 변수 쌍의 하나인 연령과 주관적 건강 인식 간의 복잡한 이원 상호작용 패턴을 시각화할 수 있었다. 본 연구는 예측 성능이 우수한 블랙박스 모형의 해석 가능성을 높이는 실용적 방법을 제시하였다는 점에서 의의가 있다.

키워드

Interpretable machine learningPartial dependence plotAccumulated local effects plotRandom forestHealth-related quality of life.해석 가능한 머신러닝Partial Dependence PlotAccumulated Local Effect Plot건강 관련 삶의 질랜덤 포레스트.
제목
해석 가능한 머신러닝을 위한 PD 플롯과 ALE 플롯의 적용: 랜덤 포레스트를 이용한 건강 관련 삶의 질 예측변수들의 효과 분석
제목 (타언어)
Partial Dependence and Accumulated Local Effect Plots for Interpretable Machine Learning: A Random Forest Application to Health-Related Quality of Life
저자
채희주장승민
발행일
2026-02
유형
Y
저널명
Journal of The Korean Data Analysis Society
28
1
페이지
419 ~ 436