전통 스코어카드 개발 가이드¶

로지스틱 회귀 기반 신용평가모형(CSS)을 변수 선정부터 스코어카드 변환, 모형 운영까지 순서대로 다룬다.

저자의 말

전통적인 스코어카드 개발은 분석가의 손이 정말 많이 타는 방법론이다. 단순히 Raw 데이터를 모형에 넣는 것이 아니라, 변수 하나하나를 구간화(Classing)하고 WoE로 변환하고 단변량 검정을 거쳐야 한다. 이 과정에서 분석가의 과거 경험, Classing 기준의 정의, 그리고 현업과의 협의 및 의사결정이 모든 단계에 깊이 개입한다.

머신러닝이 이러한 과정을 완전히 생략하는 것은 아니지만, 전통 스코어카드는 변수 하나의 선정·변환·검증에 훨씬 더 까다로운 분석 역량과 도메인 지식을 요구한다. 본 가이드북의 Part 1~5는 바로 이 과정 전체를 순서대로 다룬다.

이 섹션의 구성¶

순서	주제	핵심 내용
1	개요	CSS의 정의·분류, 서열화 vs 분류, 요건 정의, 개발 파이프라인
2	이론	이진 분류, Logit 변환, 최대우도추정(MLE)
3	변수 선정	Fine/Coarse Classing, WoE/IV, 단변량 LR, 정보영역별 선정
4	모델링	Simple LR vs Full Model, 다변량 회귀
5	스코어카드	스코어카드 변환·등급화, 성능 평가, OOT 검증, 모니터링, 규제
부록	부록	optbinning 가이드, 로지스틱 적합 비교, LOWESS 미니모델링, 기호 용어집

전체 흐름¶

요건 정의 → 변수풀 구성 → Fine Classing → Coarse Classing → WoE/IV 변환 → 단변량 LR 검증 → 정보영역별 선정 → 다변량 회귀 → 스코어카드 변환 → 등급화 → 성능 평가 → OOT 검증 → 모니터링과 운영 → 규제 프레임워크

각 단계가 이전 단계의 결과에 의존하는 순차적 파이프라인이다. Part 1에서 전체 그림을 조망한 뒤, Part 2~5에서 각 단계를 깊이 다룬다.

머신러닝 섹션과의 관계¶

이 섹션의 개념 — Odds, Good/Bad 정의, 성과 기간, 모집단 설계 — 은 머신러닝 섹션에서도 그대로 적용된다. 달라지는 것은 변수 처리 방식과 모형 구조일 뿐, 신용평가의 근본 프레임은 동일하다.

	전통 스코어카드 (이 섹션)	머신러닝
모형	로지스틱 회귀	트리 앙상블 (RF, GBM, XGB, LGBM)
변수 선정	WoE + IV	Feature Importance + SHAP
구간화	수작업 Classing	트리 split이 자동 수행
해석	점수표 = 해석	SHAP = 사후 해석
규제	규제모형 표준	챌린저 모형 / 하이브리드

다음 섹션

전통 스코어카드를 마쳤다면, 머신러닝 섹션에서 트리 기반 ML 모형의 이론과 실전을 학습한다.