콘텐츠로 이동

부록 B: 변수 상관과 모형 해석

변수 간 상관이 존재할 때, 모형 해석은 왜 어려워지는가? fANOVA와 SHAP에서 동일하게 발생하는 근본적 한계와 실무적 대응

작성 중

이 부록은 현재 작성 중이며, 내용이 추가·변경될 수 있습니다.

이 부록의 위치

부록 A: SHAP과 fANOVA에서 다룬 분해 이론의 실전 한계에 해당한다. 부록 A가 "어떻게 분해하는가"를 다뤘다면, 부록 B는 "상관된 변수가 있을 때 분해가 왜 깔끔하지 않은가"를 다룬다.

목차

섹션 제목 내용
1 두 가지 기대값 — Observational vs Interventional 조건부 기대값의 두 정의, "모형에 충실" vs "데이터에 충실"
2 fANOVA의 두 Measure — Joint vs Product Joint/Product measure 수치 비교, Cross-covariance의 불가피성
3 SHAP의 두 모드 tree_path_dependent vs interventional, Lundberg의 입장
4 독립 가정의 한계 — 왜 외삽이 발생하는가 Product measure의 비현실적 조합, Dummy 공리 위반
5 실무 권장 — 상관 변수 해석 전략 양쪽 결과 비교, EBM Purification, 해석 시 주의점

핵심 참고 문헌

  • Chen, Lundberg, Lee (2020). True to the Model or True to the Data?
  • Hooker (2007). Generalized Functional ANOVA Diagnostics for High-Dimensional Functions of Dependent Variables. JCGS
  • Sundararajan & Najmi (2020). The many Shapley values for model explanation. ICML
  • Hooker, Mentch, Zhou (2021). Unrestricted Permutation Forces Extrapolation. Statistics and Computing
  • Lengerich et al. (2020). Purifying Interaction Effects with the Functional ANOVA. AISTATS