카테고리 없음

머신러닝 모델 유형별 대표적인 평가 지표

aimler 2025. 7. 25. 17:30
반응형

> 분류( Classification ) 모델 평가 지표

지표명 설명 특징/용도
Accuracy (정확도) 전체 중 맞게 예측한 비율 클래스 균형이 잘 맞을 때 적합
Precision (정밀도) 양성 예측 중 실제 양성 비율 FP(거짓양성) 줄일 때 중요
Recall (재현율) 실제 양성 중 맞게 예측한 비율 FN(거짓음성) 줄일 때 중요
F1 Score 정밀도와 재현율의 조화평균 정밀도와 재현율 균형 필요할 때
ROC-AUC 거짓양성비율 대비 참양성비율 곡선 아래 면적 임계값 무관, 클래스 불균형 문제에 강함
PR-AUC (P-R 곡선 아래 면적) 정밀도와 재현율 곡선 아래 면적 불균형 데이터에서 성능 평가에 더 적합
Confusion Matrix TP, FP, TN, FN 행렬 형태로 예측 결과 요약 다양한 지표 계산의 기본 자료
Log Loss (Cross-Entropy) 확률 예측과 실제값 간 차이 확률 기반 분류 모델 성능 평가
MCC (Matthews Correlation Coefficient) 불균형 데이터에서 균형 잡힌 평가 지표 데이터 불균형 심할 때 권장

 

 

> 회귀 (Regression) 모델 평가 지표

지표명 설명 특징/용도
MSE (Mean Squared Error) 오차 제곱의 평균 큰 오차에 민감
RMSE (Root MSE) MSE의 제곱근 단위가 원래 값과 같아 해석 용이
MAE (Mean Absolute Error) 절대 오차 평균 이상치에 덜 민감
MAPE (Mean Absolute Percentage Error) 절대 오차를 실제 값으로 나눈 비율의 평균 (백분율) 오차를 %로 직관적으로 표현, 0에 가까운 값 주의
R² (결정계수) 모델이 데이터 분산을 얼마나 설명하는지 비율 1에 가까울수록 좋은 설명력

 

 

> 클러스터링 (Clustering) 평가 지표

지표명 설명 특징/용도
Silhouette Score 군집 간 거리와 군집 내 거리 비율 1에 가까울수록 군집 품질 좋음
Davies-Bouldin Index 군집 간 거리 대비 군집 내 거리 비율 값이 작을수록 군집 품질 좋음
Calinski-Harabasz Index 군집 간 분산 대비 군집 내 분산 비율 값이 클수록 군집 품질 좋음

 

반응형