WoE 직접 투입¶

1.1 수리적 구조 및 점수 변환¶

각 관측치의 구간에 해당하는 WoE 값을 연속형 숫자로 투입한다.

\[ \text{logit}(p_i) = \beta_0 + \sum_{j=1}^{k} \beta_j \cdot \text{WoE}_{ij} \tag{A.1} \]

변수 \(j\)의 구간 \(b\)에 대한 스코어카드 부분점수는 단일 \(\beta_j\)에서 파생된다.

\[ \text{부분점수}_{jb} = -B \cdot \beta_j \cdot \text{WoE}_{jb}, \quad B = \frac{\text{PDO}}{\ln 2} \tag{A.2} \]

특성

WoE 값의 크기 차이가 그대로 점수 차이로 반영된다. 어떤 구간의 WoE가 다른 구간보다 2배 높으면 기여 점수도 정확히 2배다. 이는 WoE 값의 순서와 간격을 모형이 신뢰한다는 의미이므로, 구간화 단조성 조건이 충족되어야 결과가 의미 있다.

1.2 기준점 설정: 평행이동¶

더미 변수 방식에서는 기준 범주의 더미 벡터가 \([0, \dots, 0]\)이므로, 해당 구간의 효과가 절편에 흡수되어 자동으로 부분점수 = 0인 기준점이 만들어진다(두 방식 비교 참조).

WoE 방식은 연속형 수치를 그대로 투입하므로 이런 자연 기준점이 없다. 대신, 기준으로 삼을 구간의 WoE 값(\(\text{WoE}_{j,\text{ref}}\))만큼 전체를 평행이동하여 사후적으로 기준점을 설정한다.

\[ \text{조정점수}_{jb} = -B \cdot \beta_j \cdot (\text{WoE}_{jb} - \text{WoE}_{j,\text{ref}}) \tag{A.3} \]

평행이동한 값(\(B \cdot \beta_j \cdot \text{WoE}_{j,\text{ref}}\))은 절편에 흡수시켜 총점을 유지한다. 이렇게 하면 더미 방식과 동일한 "기준 구간 = 0점" 구조가 된다. 즉 두 방식은 표현 형식의 차이이며, 동일한 스코어카드 구조로 변환 가능하다.