전통 스코어카드 개발 가이드¶
로지스틱 회귀 기반 신용평가모형(CSS)을 변수 선정부터 스코어카드 변환, 모형 운영까지 순서대로 다룬다.
저자의 말
전통적인 스코어카드 개발은 분석가의 손이 정말 많이 타는 방법론이다. 단순히 Raw 데이터를 모형에 넣는 것이 아니라, 변수 하나하나를 구간화(Classing)하고 WoE로 변환하고 단변량 검정을 거쳐야 한다. 이 과정에서 분석가의 과거 경험, Classing 기준의 정의, 그리고 현업과의 협의 및 의사결정이 모든 단계에 깊이 개입한다.
머신러닝이 이러한 과정을 완전히 생략하는 것은 아니지만, 전통 스코어카드는 변수 하나의 선정·변환·검증에 훨씬 더 까다로운 분석 역량과 도메인 지식을 요구한다. 본 가이드북의 Part 1~5는 바로 이 과정 전체를 순서대로 다룬다.
이 섹션의 구성¶
| 순서 | 주제 | 핵심 내용 |
|---|---|---|
| 1 | 개요 | CSS의 정의·분류, 서열화 vs 분류, 요건 정의, 개발 파이프라인 |
| 2 | 이론 | 이진 분류, Logit 변환, 최대우도추정(MLE) |
| 3 | 변수 선정 | Fine/Coarse Classing, WoE/IV, 단변량 LR, 정보영역별 선정 |
| 4 | 모델링 | Simple LR vs Full Model, 다변량 회귀 |
| 5 | 스코어카드 | 스코어카드 변환·등급화, 성능 평가, OOT 검증, 모니터링, 규제 |
| 부록 | 부록 | optbinning 가이드, 로지스틱 적합 비교, LOWESS 미니모델링, 기호 용어집 |
전체 흐름¶
요건 정의 → 변수풀 구성 → Fine Classing → Coarse Classing → WoE/IV 변환 → 단변량 LR 검증 → 정보영역별 선정 → 다변량 회귀 → 스코어카드 변환 → 등급화 → 성능 평가 → OOT 검증 → 모니터링과 운영 → 규제 프레임워크
각 단계가 이전 단계의 결과에 의존하는 순차적 파이프라인이다. Part 1에서 전체 그림을 조망한 뒤, Part 2~5에서 각 단계를 깊이 다룬다.
머신러닝 섹션과의 관계¶
이 섹션의 개념 — Odds, Good/Bad 정의, 성과 기간, 모집단 설계 — 은 머신러닝 섹션에서도 그대로 적용된다. 달라지는 것은 변수 처리 방식과 모형 구조일 뿐, 신용평가의 근본 프레임은 동일하다.
| 전통 스코어카드 (이 섹션) | 머신러닝 | |
|---|---|---|
| 모형 | 로지스틱 회귀 | 트리 앙상블 (RF, GBM, XGB, LGBM) |
| 변수 선정 | WoE + IV | Feature Importance + SHAP |
| 구간화 | 수작업 Classing | 트리 split이 자동 수행 |
| 해석 | 점수표 = 해석 | SHAP = 사후 해석 |
| 규제 | 규제모형 표준 | 챌린저 모형 / 하이브리드 |
다음 섹션
전통 스코어카드를 마쳤다면, 머신러닝 섹션에서 트리 기반 ML 모형의 이론과 실전을 학습한다.