ROC_AUC_Score / Accuracy / F1 Score의 차이와 선택 기준

안녕하세요,

roc_auc_score / accuracy / f1_score의 차이와 선택 기준에 대하여 알아보겠습니다.

roc_auc_score, accuracy, f1_score는 모두 모델의 성능을 평가하는 지표지만,

평가하는 관점과 사용하는 상황이 다릅니다.

ROC AUC는 이진 분류 모델에서 주로 사용되는 성능 지표로, 모델의 분류 성능을 종합적으로 평가합니다.

ROC 곡선: 모델의 **참 양성 비율 (True Positive Rate, TPR)**과 **거짓 양성 비율 (False Positive Rate, FPR)**을 각각 y축과 x축에 나타낸 그래프입니다.
AUC (Area Under the Curve): ROC 곡선 아래 면적을 나타내며, 0.5에서 1 사이의 값이 됩니다. 0.5는 랜덤 분류, 1에 가까울수록 좋은 성능을 의미합니다.

Accuracy는 전체 예측 중 정답의 비율을 계산하는 가장 기본적인 성능 지표입니다.

장점: 계산이 간단하고 직관적입니다.
단점: 데이터 클래스가 불균형할 때는 부적합합니다. 예를 들어, 90%가 '0'인 데이터셋에서 무조건 '0'으로 예측해도 90%의 정확도가 나오기 때문에, 불균형 데이터에서 정확한 성능을 반영하지 못합니다.

F1 Score는 Precision(정밀도)과 Recall(재현율)을 조합한 지표로, 이진 분류에서 주로 사용됩니다.

불균형 데이터에서 특히 유용합니다.

감사합니다.

빅데이터 분석기사 _3유형 정리 (1)	2024.11.21
numpy의 concatenate() 함수를 사용할때 zero-dimensional arrays cannot be concatenated 오류 (1)	2024.11.17
MAE / MSE / RMSE 차이와 선택 기준은? (2)	2024.11.15
빅분기_실기_OneHotEncoding후 predict()할때 발생하는 오류 (1)	2024.11.13
python을 이용한 머신러닝과 딥러닝은 뭐가 다를까? (2)	2024.11.12

암자의 코딩생활