변수 선정: Classing → WoE/IV → 단변량 회귀 → 정보영역별 선정¶
후보 변수를 구간화하고, 변별력을 측정하고, 통계적으로 검증한 뒤, 정보영역별로 대표 변수를 확정하는 전 과정
신용평가모형의 변수 선정(Feature Selection)은 네 단계로 구성된다. 각 단계는 독립적이면서도 순환적인 피드백 루프로 연결된다.
Classing (구간화) → WoE/IV (변별력 측정) → 단변량 로지스틱 회귀 (유의성 검정) → 정보영역별 변수 선정 (영역 내 다중공선성 제거) → Full Model
네 단계 개요¶
| 단계 | 섹션 | 핵심 질문 |
|---|---|---|
| 1 | Classing | 연속형 변수를 어떻게 구간화하는가? Fine → Coarse 과정은? |
| 2 | WoE / IV | 각 구간에 WoE를 부여하고, IV로 변수 전체의 변별력을 어떻게 측정하는가? |
| 3 | 단변량 로지스틱 회귀 | WoE 산출 이후, 통계적 유의성을 어떻게 검정하는가? |
| 4 | 정보영역별 변수 선정 | 동일 정보영역 내 다중공선성을 제거하고, 영역별 대표 변수를 어떻게 확정하는가? |
Odds 방향: Bad Odds
변수 선정 전 과정(Classing ~ 단변량 회귀)은 Bad Odds \(p/(1-p)\)를 사용한다. Good Odds \((1-p)/p\)로의 전환은 스코어카드 변환에서 이루어진다.