부록 B: 변수 상관과 모형 해석¶
변수 간 상관이 존재할 때, 모형 해석은 왜 어려워지는가? fANOVA와 SHAP에서 동일하게 발생하는 근본적 한계와 실무적 대응
작성 중
이 부록은 현재 작성 중이며, 내용이 추가·변경될 수 있습니다.
이 부록의 위치
부록 A: SHAP과 fANOVA에서 다룬 분해 이론의 실전 한계에 해당한다. 부록 A가 "어떻게 분해하는가"를 다뤘다면, 부록 B는 "상관된 변수가 있을 때 분해가 왜 깔끔하지 않은가"를 다룬다.
목차¶
| 섹션 | 제목 | 내용 |
|---|---|---|
| 1 | 두 가지 기대값 — Observational vs Interventional | 조건부 기대값의 두 정의, "모형에 충실" vs "데이터에 충실" |
| 2 | fANOVA의 두 Measure — Joint vs Product | Joint/Product measure 수치 비교, Cross-covariance의 불가피성 |
| 3 | SHAP의 두 모드 | tree_path_dependent vs interventional, Lundberg의 입장 |
| 4 | 독립 가정의 한계 — 왜 외삽이 발생하는가 | Product measure의 비현실적 조합, Dummy 공리 위반 |
| 5 | 실무 권장 — 상관 변수 해석 전략 | 양쪽 결과 비교, EBM Purification, 해석 시 주의점 |
핵심 참고 문헌
- Chen, Lundberg, Lee (2020). True to the Model or True to the Data?
- Hooker (2007). Generalized Functional ANOVA Diagnostics for High-Dimensional Functions of Dependent Variables. JCGS
- Sundararajan & Najmi (2020). The many Shapley values for model explanation. ICML
- Hooker, Mentch, Zhou (2021). Unrestricted Permutation Forces Extrapolation. Statistics and Computing
- Lengerich et al. (2020). Purifying Interaction Effects with the Functional ANOVA. AISTATS