기호 용어집¶

본 가이드북 전체에서 사용하는 주요 기호와 약어를 정리한다.

확률·오즈 관련¶

기호	정의	사용 위치
\(p\) 또는 \(P(y=1 \mid \mathbf{x})\)	불량(Bad) 확률	전체
\(\text{Odds} = p/(1-p)\)	Bad Odds — 불량 대비 정상의 비율	개요~단변량 LR
\(\text{Good Odds} = (1-p)/p\)	Good Odds — 정상 대비 불량의 비율	스코어카드 변환
\(\text{Logit}(p) = \ln(p/(1-p))\)	로그 오즈 (Log-Odds)	이론
\(\eta = \beta_0 + \boldsymbol{\beta}^\top \mathbf{x}\)	선형 예측자 (Linear Predictor)	이론, MLE
\(\mathcal{L}(\boldsymbol{\beta})\)	우도함수 (Likelihood Function)	이론
\(\ell(\boldsymbol{\beta}) = \ln \mathcal{L}\)	로그우도함수 (Log-Likelihood)	이론, MLE

기호	정의	사용 위치
\(z = \hat{\beta}_j / \text{SE}(\hat{\beta}_j)\)	Wald 검정 통계량	단변량 LR, 유의성 검정
\(\chi^2\)	카이제곱 통계량	유의성 검정
\(p\text{-value}\)	유의확률 — 귀무가설 하에서 관측값 이상의 극단적 결과가 나올 확률	유의성 검정

기호	정의	사용 위치
\(n_{G,i}\), \(n_{B,i}\)	Bin \(i\)의 Good/Bad 건수	WoE/IV
\(N_G\), \(N_B\)	전체 Good/Bad 건수	WoE/IV
\(\%\text{Good}_i = n_{G,i}/N_G\)	전체 Good 중 Bin \(i\) 비중	WoE/IV
\(\%\text{Bad}_i = n_{B,i}/N_B\)	전체 Bad 중 Bin \(i\) 비중	WoE/IV
\(\text{WoE}_i = \ln(\%\text{Good}_i / \%\text{Bad}_i)\)	Weight of Evidence	WoE/IV
\(\text{IV} = \sum (\%\text{Good}_i - \%\text{Bad}_i) \times \text{WoE}_i\)	Information Value	WoE/IV

기호	정의	사용 위치
KS	Kolmogorov-Smirnov 통계량 — Good/Bad 누적분포 최대 차이	성능 평가
AR (Gini)	Accuracy Ratio — CAP 곡선 기반 누적 변별력	성능 평가
AUC	Area Under ROC Curve — \(\text{AR} = 2 \times \text{AUC} - 1\)	성능 평가
PSI	Population Stability Index — 점수 분포 안정성	성능 평가
AUROC	Area Under ROC Curve — AUC와 동의어	성능 평가
ROC	Receiver Operating Characteristic — 민감도 vs 1-특이도 곡선	성능 평가
CAP	Cumulative Accuracy Profile — AR 산출의 기초 곡선	성능 평가
CSI	Characteristic Stability Index — 개별 변수의 분포 안정성 지표	성능 평가
VIF	Variance Inflation Factor — 다중공선성 진단	모델링
Concordance	일치쌍 — 모형이 Bad를 더 높은 확률로 예측한 Good-Bad 쌍의 비율	성능 평가
Discordance	불일치쌍 — Concordance의 반대	성능 평가

약어	풀이	비고
CSS	Credit Scoring System	신용평가모형
AS	Application Scoring	신청 시점 평가
BS	Behavioral Scoring	기존 고객 행동 평가
CB	Credit Bureau	신용정보원 (NICE, KCB 등)
IRB	Internal Ratings-Based approach	Basel 내부등급법
MLE	Maximum Likelihood Estimation	최대우도추정
LRT	Likelihood Ratio Test	우도비 검정
OOT	Out-of-Time	시간 외 검증 샘플
PD	Probability of Default	부도확률
TTC	Through-the-Cycle	경기순환 조정
EDF	Expected Default Frequency	기대부도빈도 (Moody's 등에서 사용)
LGD	Loss Given Default	부도시 손실률
EAD	Exposure At Default	부도시 익스포저
LOWESS	Locally Weighted Scatterplot Smoothing	국소 가중 산점도 평활법
MoC	Margin of Conservatism	보수성 가산

용어	정의	사용 위치
Fine Classing	연속변수를 다수의 세분화 구간으로 초기 분할하는 단계	변수 선정
Coarse Classing	Fine Classing 결과를 유사 구간끼리 병합하여 최종 구간을 확정하는 단계	변수 선정
단조성 (Monotonicity)	WoE 또는 Bad Rate가 구간 순서대로 일관되게 증가 또는 감소하는 성질	변수 선정
Observation Window	변수 산출에 사용하는 과거 데이터 기간	개요
Performance Window	목표변수(Good/Bad) 판정을 위한 관찰 기간	개요
Vintage 분석	동일 시점 대출 코호트의 시간 경과별 부도율을 추적하는 분석 기법	개요
Roll Rate	연체 단계 간 전이율 (예: 정상→30일 연체, 30일→60일 연체)	개요
Target Leakage	미래 정보가 모델 학습 시점에 유입되어 과적합을 유발하는 오류	개요
미니모델링	LOWESS 기반으로 단변량 부도확률을 추정·변환하는 기법	부록 C