단변량 로지스틱 회귀: 유의성 검정과 Classing 피드백 루프¶
변수 선정의 마지막 단계 — WoE 계산 이후, 각 구간의 통계적 유의성을 검정하고 Classing 품질을 진단하는 전 과정
Odds 방향 — 이 섹션은 여전히 Bad Odds
단변량 로지스틱 회귀는 Bad를 \(y=1\)로 놓고 Bad Odds \(p/(1-p)\)를 모델링한다. β ≈ WoE 증명의 수식도 Bad Odds 기반이다.
Good Odds \((1-p)/p\)로의 전환은 스코어카드 변환에서 이루어진다. 점수 공식 \(\text{Score} = A - B \times \text{logit}\)의 마이너스 부호가 방향을 뒤집는 역할을 한다.
변수 선정은 Classing → WoE/IV → 단변량 로지스틱 회귀의 세 단계로 구성되며, 이 섹션에서는 그 마지막 단계인 단변량 로지스틱 회귀를 다룬다.
WoE는 단순 집계값이라 표준오차도, p-value도 없다. 단변량 로지스틱 회귀를 통해 비로소 각 Bin에 대한 통계적 유의성이 산출되며, Classing의 품질을 객관적으로 검증할 수 있다.
Classing → WoE/IV 산출 → 단변량 로지스틱 회귀 (유의성 검정) → Classing 피드백 루프 → 확정 or 재시도
이 섹션에서 다루는 내용¶
| 섹션 | 제목 | 핵심 질문 |
|---|---|---|
| 1 | 개념과 목적 | WoE가 이미 계산되었는데 왜 다시 회귀를 돌리는가? |
| 2 | One-Hot + No Intercept | 왜 k-1 더미 대신 k개 더미 + 절편 제거를 사용하는가? |
| 3 | β ≈ WoE 증명 | No Intercept 회귀에서 추정 계수가 WoE와 일치하는 이유는? |
| 4 | 유의성 검정 | Wald Test와 LRT로 Bin별·변수별 유의성을 어떻게 판단하는가? |
| 5 | Classing 피드백 루프 | 비유의 Bin을 어떻게 처리하며, 최종 확정까지의 절차는? |
다음 섹션
단변량 로지스틱 회귀를 마치면 확정된 변수들을 모델링 · 스코어카드에서 다변량 모형으로 통합하고 점수로 변환한다.