반응형
회귀 분석에서 모델의 예측 정확도를 평가하기 위한 손실 함수(Loss Function)인
MAE (Mean Absolute Error) / MSE (Mean Squared Error) / RMSE (Root Mean Squared Error) 의 차이점에 대하여 알아보겠습니다.
MAE / MSE / RMSE의 대표적인 차이점은 오차를 계산하는 방식에 있습니다
1. MAE (Mean Absolute Error)
MAE는 예측값과 실제값 사이의 절대 오차의 평균을 구하는 지표입니다.
- 장점: 이상치(Outlier)에 덜 민감합니다. 모든 오차를 절대값으로 계산하므로, 큰 오차가 있어도 직접적인 영향을 주지 않습니다.
- 단점: 미분이 불가능한 점이 있어, 일부 최적화 알고리즘에서 사용이 어려울 수 있습니다.
2. MSE (Mean Squared Error)
MSE는 예측값과 실제값 사이의 제곱 오차의 평균을 구하는 지표입니다.
- 장점: 미분이 가능하여 많은 최적화 알고리즘에서 사용하기에 용이합니다.
- 단점: 오차를 제곱하여 계산하므로, 이상치에 매우 민감합니다. 큰 오차가 있을 경우 제곱으로 인해 손실 값이 크게 증가합니다.
3. RMSE (Root Mean Squared Error)
RMSE는 MSE에 제곱근을 취하여, 원래 데이터와 같은 단위로 해석할 수 있게 만든 지표입니다.
- 장점: MSE와 달리 예측 오차가 원래 값과 같은 단위로 나타나 해석이 더 직관적입니다. 이상치에 민감하면서도, 해석이 용이합니다.
- 단점: MSE와 마찬가지로 이상치에 민감하며, 큰 오차의 영향을 크게 받습니다.
정리
- MAE는 절대 오차를 기반으로, 이상치에 덜 민감한 지표입니다.
- MSE는 오차를 제곱하여 계산하므로, 이상치에 민감하고 미분이 가능합니다.
- RMSE는 MSE에 제곱근을 취하여, 해석을 더 직관적으로 만든 지표입니다.
선택 기준
- 이상치가 적은 경우: MSE나 RMSE를 사용하여 더 민감하게 오차를 반영할 수 있습니다.
- 이상치가 많은 경우: MAE가 더 적합할 수 있습니다.
반응형
'BigData' 카테고리의 다른 글
numpy의 concatenate() 함수를 사용할때 zero-dimensional arrays cannot be concatenated 오류 (1) | 2024.11.17 |
---|---|
ROC_AUC_Score / Accuracy / F1 Score의 차이와 선택 기준 (1) | 2024.11.16 |
빅분기_실기_OneHotEncoding후 predict()할때 발생하는 오류 (1) | 2024.11.13 |
python을 이용한 머신러닝과 딥러닝은 뭐가 다를까? (2) | 2024.11.12 |
[ 개인 기록용 ] 빅데이터분석기사 실기 관련 정리 사항 (0) | 2024.11.10 |