개요¶
전통 스코어카드의 한계, ML 도입의 동기, Bias-Variance Tradeoff, 데이터 분리, 피처 엔지니어링까지 — 트리 모형을 학습하기 전에 갖춰야 할 기초 프레임을 다룬다.
이 섹션에서 다루는 내용¶
| 섹션 | 제목 | 핵심 내용 |
|---|---|---|
| 1 | 왜 ML인가 | 전통 스코어카드의 한계, ML의 해법, 트리 앙상블이 tabular에 강한 이유, 규제 환경 |
| 2 | Bias-Variance Tradeoff | EPE 분해, 멍청한/똑똑한 모형, 모형 복잡도와 Tradeoff |
| 3 | 정규화 — Ridge · Lasso · Shrinkage | L1/L2 정규화, Elastic Net, Shrinkage Path, 트리·뉴럴넷 확장 |
| 4 | Baseline 워크플로우 | LR·RF로 성능 하한/상한 파악, 비선형성 진단 |
| 5 | 데이터 분리 전략 | OOS/Hold-out/CV 구조, 층화추출, Bias-Variance 진단, OOT |
| 6 | 피처 전처리 | 전통 vs 트리 비교, 스케일링 불필요 이유, 범주형 인코딩, 결측치, 이상치 |
| 7 | 피처 선택 · 파생변수 | Feature Importance, Permutation, SHAP, Boruta, 도메인 기반 파생변수 |
다음 섹션
개요를 마쳤다면, 뉴럴넷에서 신경망의 기초와 신용평가에서의 적용을 학습한다.