카테고리 없음
머신러닝 모델 유형별 대표적인 평가 지표
aimler
2025. 7. 25. 17:30
반응형
> 분류( Classification ) 모델 평가 지표
지표명 | 설명 | 특징/용도 |
Accuracy (정확도) | 전체 중 맞게 예측한 비율 | 클래스 균형이 잘 맞을 때 적합 |
Precision (정밀도) | 양성 예측 중 실제 양성 비율 | FP(거짓양성) 줄일 때 중요 |
Recall (재현율) | 실제 양성 중 맞게 예측한 비율 | FN(거짓음성) 줄일 때 중요 |
F1 Score | 정밀도와 재현율의 조화평균 | 정밀도와 재현율 균형 필요할 때 |
ROC-AUC | 거짓양성비율 대비 참양성비율 곡선 아래 면적 | 임계값 무관, 클래스 불균형 문제에 강함 |
PR-AUC (P-R 곡선 아래 면적) | 정밀도와 재현율 곡선 아래 면적 | 불균형 데이터에서 성능 평가에 더 적합 |
Confusion Matrix | TP, FP, TN, FN 행렬 형태로 예측 결과 요약 | 다양한 지표 계산의 기본 자료 |
Log Loss (Cross-Entropy) | 확률 예측과 실제값 간 차이 | 확률 기반 분류 모델 성능 평가 |
MCC (Matthews Correlation Coefficient) | 불균형 데이터에서 균형 잡힌 평가 지표 | 데이터 불균형 심할 때 권장 |
> 회귀 (Regression) 모델 평가 지표
지표명 | 설명 | 특징/용도 |
MSE (Mean Squared Error) | 오차 제곱의 평균 | 큰 오차에 민감 |
RMSE (Root MSE) | MSE의 제곱근 | 단위가 원래 값과 같아 해석 용이 |
MAE (Mean Absolute Error) | 절대 오차 평균 | 이상치에 덜 민감 |
MAPE (Mean Absolute Percentage Error) | 절대 오차를 실제 값으로 나눈 비율의 평균 (백분율) | 오차를 %로 직관적으로 표현, 0에 가까운 값 주의 |
R² (결정계수) | 모델이 데이터 분산을 얼마나 설명하는지 비율 | 1에 가까울수록 좋은 설명력 |
> 클러스터링 (Clustering) 평가 지표
지표명 | 설명 | 특징/용도 |
Silhouette Score | 군집 간 거리와 군집 내 거리 비율 | 1에 가까울수록 군집 품질 좋음 |
Davies-Bouldin Index | 군집 간 거리 대비 군집 내 거리 비율 | 값이 작을수록 군집 품질 좋음 |
Calinski-Harabasz Index | 군집 간 분산 대비 군집 내 분산 비율 | 값이 클수록 군집 품질 좋음 |
반응형