콘텐츠로 이동

신용평가모형(Credit Scoring System) 가이드북

실무 권장 — 상관 변수 해석 전략

5. 실무 권장 — 상관 변수 해석 전략¶

이론적 완벽함은 없다. 실무에서는 어떻게 대응해야 하는가?

작성 중

이 페이지는 현재 작성 중이며, 내용이 추가·변경될 수 있습니다.

다룰 내용¶

5.1 양쪽 결과를 비교하라¶

Observational(A-1/B-1)과 Interventional(A-2/B-2) 모두 계산
두 결과가 유사하면: 변수 상관이 해석에 크게 영향을 주지 않음 → 안심
두 결과가 크게 다르면: 해당 변수군의 상관이 해석을 왜곡하고 있음 → 주의 필요
우리 실험에서 변수 순위 Top 10은 대부분 유사, 미세 차이만 존재

5.2 Cross-Covariance 진단¶

전체 분산 대비 Cross-cov 비율 확인 (우리 모형: 48~52%)
쌍별 Cov(f_i, f_j) Top 20 확인 → 어떤 변수 쌍이 해석을 흐리는지 식별
상관이 높은 변수 쌍: 합산 효과로 보거나, 대표 변수 1개로 해석

5.3 EBM과 Purification¶

EBM (Lou et al., 2012, 2013): 학습 구조 자체가 main + 2-way 분리
InterpretML purify(): 학습 후 사후 정제
Lengerich et al. (2020): purification이 부호 반전을 방지한 COMPAS 사례
가이드북 부록 A-3 Purification과 연결

5.4 단조성 제약 (Monotone Constraints)¶

상관 문제와 직접 관련은 아니지만, 해석 안정성에 기여
단조 제약 걸면 shape function이 단조 → 상관에 의한 비직관적 패턴 방지
가이드북 Part 4 해석 가능성 3대 조건과 연결: bin 5개 이하, 2-way, 단조성

5.5 신용평가에서의 실무 권장¶

규제 관점: "모형이 어떤 변수를 쓰는가" → Observational이 적합
인과 관점: "변수 하나를 바꾸면 스코어가 얼마나 변하는가" → Interventional이 적합
현업 설명 시: 둘의 차이를 인지하고, 해석 목적을 명시할 것
모형검증 보고서에는 두 방식의 결과를 병기하는 것을 권장

참고

Lou et al. (2013). Accurate Intelligible Models with Pairwise Interactions. KDD
Lengerich et al. (2020). Purifying Interaction Effects with the Functional ANOVA. AISTATS
Covert, Lundberg, Lee (2020). Understanding Global Feature Contributions With Additive Importance Measures. NeurIPS