콘텐츠로 이동

개요

전통 스코어카드의 한계, ML 도입의 동기, Bias-Variance Tradeoff, 데이터 분리, 피처 엔지니어링까지 — 트리 모형을 학습하기 전에 갖춰야 할 기초 프레임을 다룬다.

이 섹션에서 다루는 내용

섹션 제목 핵심 내용
1 왜 ML인가 전통 스코어카드의 한계, ML의 해법, 트리 앙상블이 tabular에 강한 이유, 규제 환경
2 Bias-Variance Tradeoff EPE 분해, 멍청한/똑똑한 모형, 모형 복잡도와 Tradeoff
3 정규화 — Ridge · Lasso · Shrinkage L1/L2 정규화, Elastic Net, Shrinkage Path, 트리·뉴럴넷 확장
4 Baseline 워크플로우 LR·RF로 성능 하한/상한 파악, 비선형성 진단
5 데이터 분리 전략 OOS/Hold-out/CV 구조, 층화추출, Bias-Variance 진단, OOT
6 피처 전처리 전통 vs 트리 비교, 스케일링 불필요 이유, 범주형 인코딩, 결측치, 이상치
7 피처 선택 · 파생변수 Feature Importance, Permutation, SHAP, Boruta, 도메인 기반 파생변수

다음 섹션

개요를 마쳤다면, 뉴럴넷에서 신경망의 기초와 신용평가에서의 적용을 학습한다.