Preface
본 가이드북은 신용평가모형 개발의 두 가지 접근법을 다룹니다. 전통적인 로지스틱 회귀 기반 스코어카드와 머신러닝 기반 신용평가모형 — 각각의 이론, 방법론, 실무 적용을 정리하였습니다.
전통 스코어카드 파트에서는 변수의 구간화(Classing)부터 WoE/IV 변환, 단변량·다변량 로지스틱 회귀, 스코어카드 변환과 등급화, OOT 검증, 모니터링, 규제 프레임워크까지 전 과정을 순서대로 다루며, 머신러닝 파트에서는 트리 기반 모델, 피처 엔지니어링, 해석 가능성 등 실무 관점의 주제를 정리하였습니다.
본 가이드북은 저 혼자서 Claude Code와 공부를 하고, 내용 숙지를 위해 정리한 내용이니 틀린 내용이 있을 수 있다는 점을 감안하여 살펴봐주시기 바랍니다.
저자 소개¶
가이드북 구성¶
Traditional
전통 스코어카드
① 개요
CSS의 정의·목적, 분류가 아닌 서열화, 모형 분류(AS/BS/Collection), Target 정의, 성과 기간 설정, 개발 프로세스 Overview
③ 변수 선정
연속형 변수 구간화(Classing), WoE 변환과 IV 평가, 단변량 로지스틱 회귀 유의성 검정, 정보영역별 Partial LR을 통한 대표 변수 확정
⑤ 스코어카드
스코어카드 변환·등급화, KS·AR·Gini 성능 평가, OOT 검증, PSI·CSI 모니터링과 리캘리브레이션, SR 11-7·Basel·금감원 규제 프레임워크
부록
optbinning 실무 가이드, WoE 직접 투입 vs 더미 변수 비교, Stepwise 변수 선택, Score·Wald·LR 검정 이론, LOWESS 기반 미니모델링
ML
머신러닝 기반 신용평가
① ML 기초
전통 스코어카드의 한계, EPE 분해, Ridge/Lasso 정규화, 데이터 분리 전략, 범주형 인코딩, 피처 선택
② 뉴럴넷
퍼셉트론, LR = 단일 뉴런, TabNet, 사전 가정(Inductive Bias), CNN/RNN의 정형 데이터 한계, LSTM 실무 테스트
③ 트리 앙상블
트리 분할, Bagging, Gradient Boosting, XGBoost/LightGBM, 하이퍼파라미터 튜닝
④ 해석과 설명
해석 도구 총람, SHAP 이론, 1-Depth GBM 스코어카드, EBM(GA²M), fANOVA와 Purification
⑤ 모델 검증
AUC/KS/Gini, OOT 검증, PSI/CSI 모니터링, SR 11-7, EU AI Act, 한국 금융 AI 가이드라인
여신
여신 프로세스