머신러닝 모델 유형별 대표적인 평가 지표

카테고리 없음

머신러닝 모델 유형별 대표적인 평가 지표

aimler 2025. 7. 25. 17:30

> 분류( Classification ) 모델 평가 지표

지표명	설명	특징/용도
Accuracy (정확도)	전체 중 맞게 예측한 비율	클래스 균형이 잘 맞을 때 적합
Precision (정밀도)	양성 예측 중 실제 양성 비율	FP(거짓양성) 줄일 때 중요
Recall (재현율)	실제 양성 중 맞게 예측한 비율	FN(거짓음성) 줄일 때 중요
F1 Score	정밀도와 재현율의 조화평균	정밀도와 재현율 균형 필요할 때
ROC-AUC	거짓양성비율 대비 참양성비율 곡선 아래 면적	임계값 무관, 클래스 불균형 문제에 강함
PR-AUC (P-R 곡선 아래 면적)	정밀도와 재현율 곡선 아래 면적	불균형 데이터에서 성능 평가에 더 적합
Confusion Matrix	TP, FP, TN, FN 행렬 형태로 예측 결과 요약	다양한 지표 계산의 기본 자료
Log Loss (Cross-Entropy)	확률 예측과 실제값 간 차이	확률 기반 분류 모델 성능 평가
MCC (Matthews Correlation Coefficient)	불균형 데이터에서 균형 잡힌 평가 지표	데이터 불균형 심할 때 권장

> 회귀 (Regression) 모델 평가 지표

지표명	설명	특징/용도
MSE (Mean Squared Error)	오차 제곱의 평균	큰 오차에 민감
RMSE (Root MSE)	MSE의 제곱근	단위가 원래 값과 같아 해석 용이
MAE (Mean Absolute Error)	절대 오차 평균	이상치에 덜 민감
MAPE (Mean Absolute Percentage Error)	절대 오차를 실제 값으로 나눈 비율의 평균 (백분율)	오차를 %로 직관적으로 표현, 0에 가까운 값 주의
R² (결정계수)	모델이 데이터 분산을 얼마나 설명하는지 비율	1에 가까울수록 좋은 설명력

> 클러스터링 (Clustering) 평가 지표

지표명	설명	특징/용도
Silhouette Score	군집 간 거리와 군집 내 거리 비율	1에 가까울수록 군집 품질 좋음
Davies-Bouldin Index	군집 간 거리 대비 군집 내 거리 비율	값이 작을수록 군집 품질 좋음
Calinski-Harabasz Index	군집 간 분산 대비 군집 내 분산 비율	값이 클수록 군집 품질 좋음