이론 기반¶
신용평가모형의 통계적 기초: 이진분류, Logit 변환, 최대우도추정(MLE)
신용평가모형(CSS)은 차주의 불량 여부를 예측하는 이진 분류 문제다. 이를 풀기 위해 로지스틱 회귀를 사용하며, 그 이론적 기초는 세 단계로 구성된다.
- 문제 정의 — 확률 \(p \in [0,1]\)를 직접 선형회귀로 모형화할 수 없는 이유를 확인한다.
- Logit 변환 — 확률을 Odds → Log-Odds로 변환하여 실수 전체 범위 \((-\infty, +\infty)\)로 매핑한다.
- MLE — 변환된 공간에서 관측 데이터의 우도를 최대화하는 계수 \(\boldsymbol{\beta}\)를 추정한다.
확률 \(\xrightarrow{\text{Odds}}\) \((0,\infty)\) \(\xrightarrow{\ln}\) \((-\infty,\infty)\) \(\xrightarrow{\text{선형 모형}}\) \(\beta_0 + \boldsymbol{\beta}^\top\mathbf{x}\)
이 섹션에서 다루는 내용¶
| 섹션 | 제목 | 핵심 질문 |
|---|---|---|
| 1 | 문제 정의 | 왜 선형회귀를 직접 쓸 수 없는가? |
| 2 | Logit 변환 | Odds · Log-Odds · Sigmoid는 어떻게 연결되는가? |
| 3 | MLE | 로지스틱 회귀의 계수는 어떻게 추정하는가? |
다음 섹션
이론을 마쳤다면, 변수 선정에서 연속형 변수를 구간화(Classing)하고 WoE/IV로 변별력을 측정하는 실무 절차를 학습한다.