콘텐츠로 이동

기호 용어집

본 가이드북 전체에서 사용하는 주요 기호와 약어를 정리한다.

확률·오즈 관련

기호 정의 사용 위치
\(p\) 또는 \(P(y=1 \mid \mathbf{x})\) 불량(Bad) 확률 전체
\(\text{Odds} = p/(1-p)\) Bad Odds — 불량 대비 정상의 비율 개요~단변량 LR
\(\text{Good Odds} = (1-p)/p\) Good Odds — 정상 대비 불량의 비율 스코어카드 변환
\(\text{Logit}(p) = \ln(p/(1-p))\) 로그 오즈 (Log-Odds) 이론
\(\eta = \beta_0 + \boldsymbol{\beta}^\top \mathbf{x}\) 선형 예측자 (Linear Predictor) 이론, MLE
\(\mathcal{L}(\boldsymbol{\beta})\) 우도함수 (Likelihood Function) 이론
\(\ell(\boldsymbol{\beta}) = \ln \mathcal{L}\) 로그우도함수 (Log-Likelihood) 이론, MLE

모형 계수 관련

기호 정의 사용 위치
\(\beta_0\) 절편 (Intercept) 모델링
\(\beta_j\) 변수 \(j\)의 회귀계수 전체
\(\hat{\beta}\) MLE로 추정된 계수 이론, 단변량 LR
\(\text{SE}(\hat{\beta}_j)\) 계수의 표준오차 유의성 검정
\(e^{\beta_j}\) 오즈비 (Odds Ratio) 이론

검정 통계량 관련

기호 정의 사용 위치
\(z = \hat{\beta}_j / \text{SE}(\hat{\beta}_j)\) Wald 검정 통계량 단변량 LR, 유의성 검정
\(\chi^2\) 카이제곱 통계량 유의성 검정
\(p\text{-value}\) 유의확률 — 귀무가설 하에서 관측값 이상의 극단적 결과가 나올 확률 유의성 검정

WoE·IV 관련

기호 정의 사용 위치
\(n_{G,i}\), \(n_{B,i}\) Bin \(i\)의 Good/Bad 건수 WoE/IV
\(N_G\), \(N_B\) 전체 Good/Bad 건수 WoE/IV
\(\%\text{Good}_i = n_{G,i}/N_G\) 전체 Good 중 Bin \(i\) 비중 WoE/IV
\(\%\text{Bad}_i = n_{B,i}/N_B\) 전체 Bad 중 Bin \(i\) 비중 WoE/IV
\(\text{WoE}_i = \ln(\%\text{Good}_i / \%\text{Bad}_i)\) Weight of Evidence WoE/IV
\(\text{IV} = \sum (\%\text{Good}_i - \%\text{Bad}_i) \times \text{WoE}_i\) Information Value WoE/IV

스코어카드 관련

기호 정의 사용 위치
\(A_{\text{target}}\) Anchor Score — 기준 Odds에서의 목표 점수 스코어카드 변환
\(A_{\text{const}}\) Score 수식의 상수항 스코어카드 변환
\(B = \text{PDO}/\ln 2\) 스케일링 상수 스코어카드 변환
\(\theta_0\) 기준 Odds (Good:Bad) 스코어카드 변환
PDO Points to Double the Odds 스코어카드 변환

성능 지표 관련

기호 정의 사용 위치
KS Kolmogorov-Smirnov 통계량 — Good/Bad 누적분포 최대 차이 성능 평가
AR (Gini) Accuracy Ratio — CAP 곡선 기반 누적 변별력 성능 평가
AUC Area Under ROC Curve — \(\text{AR} = 2 \times \text{AUC} - 1\) 성능 평가
PSI Population Stability Index — 점수 분포 안정성 성능 평가
AUROC Area Under ROC Curve — AUC와 동의어 성능 평가
ROC Receiver Operating Characteristic — 민감도 vs 1-특이도 곡선 성능 평가
CAP Cumulative Accuracy Profile — AR 산출의 기초 곡선 성능 평가
CSI Characteristic Stability Index — 개별 변수의 분포 안정성 지표 성능 평가
VIF Variance Inflation Factor — 다중공선성 진단 모델링
Concordance 일치쌍 — 모형이 Bad를 더 높은 확률로 예측한 Good-Bad 쌍의 비율 성능 평가
Discordance 불일치쌍 — Concordance의 반대 성능 평가

약어

약어 풀이 비고
CSS Credit Scoring System 신용평가모형
AS Application Scoring 신청 시점 평가
BS Behavioral Scoring 기존 고객 행동 평가
CB Credit Bureau 신용정보원 (NICE, KCB 등)
IRB Internal Ratings-Based approach Basel 내부등급법
MLE Maximum Likelihood Estimation 최대우도추정
LRT Likelihood Ratio Test 우도비 검정
OOT Out-of-Time 시간 외 검증 샘플
PD Probability of Default 부도확률
TTC Through-the-Cycle 경기순환 조정
EDF Expected Default Frequency 기대부도빈도 (Moody's 등에서 사용)
LGD Loss Given Default 부도시 손실률
EAD Exposure At Default 부도시 익스포저
LOWESS Locally Weighted Scatterplot Smoothing 국소 가중 산점도 평활법
MoC Margin of Conservatism 보수성 가산

주요 용어

용어 정의 사용 위치
Fine Classing 연속변수를 다수의 세분화 구간으로 초기 분할하는 단계 변수 선정
Coarse Classing Fine Classing 결과를 유사 구간끼리 병합하여 최종 구간을 확정하는 단계 변수 선정
단조성 (Monotonicity) WoE 또는 Bad Rate가 구간 순서대로 일관되게 증가 또는 감소하는 성질 변수 선정
Observation Window 변수 산출에 사용하는 과거 데이터 기간 개요
Performance Window 목표변수(Good/Bad) 판정을 위한 관찰 기간 개요
Vintage 분석 동일 시점 대출 코호트의 시간 경과별 부도율을 추적하는 분석 기법 개요
Roll Rate 연체 단계 간 전이율 (예: 정상→30일 연체, 30일→60일 연체) 개요
Target Leakage 미래 정보가 모델 학습 시점에 유입되어 과적합을 유발하는 오류 개요
미니모델링 LOWESS 기반으로 단변량 부도확률을 추정·변환하는 기법 부록 C