반응형 Predict3 [AI] 머신러닝 핵심 개념 요약 정리 - Day_1 안녕하세요, 개인 공부한 내용을 정리하는 게시글입니다. 머신러닝 핵심 개념 요약 정리 - Day_1 1. 모델 성능과 일반화: 과대적합 vs 과소적합용어설명특징판단 기준과대적합 (Overfitting)훈련 세트에서는 매우 잘 맞지만 테스트 세트 성능이 낮음훈련 성능 ▶ 테스트 성능R²(train) ≫ R²(test)과소적합 (Underfitting)모델이 데이터의 패턴을 잘 학습하지 못함전체적으로 성능이 낮음R²(train) ≈ R²(test) 모두 낮음 or test > train적절한 학습적당히 일반화된 모델훈련 세트가 조금 더 높지만 큰 차이는 없음R²(train) > R²(test) (약간 높음)* R²: 결정계수. 회귀 모델의 예측력이 얼마나 좋은지를 나타내는 지표 (1에 가까울수록 좋음) 2.. 2025. 5. 30. 빅분기_실기_OneHotEncoding후 predict()할때 발생하는 오류 OneHotEncoding을 할 때 pd.get_dummies()를 자주 쓰게 되는데 train에는 있고 test에는 없는 컬럼값이 있을 수 있다.그렇게 get_dummies()를 수행하면 컬럼의 개수가 달라져서 차후에 모델에 predict()를 할때 다음과 같은 오류가 발생한다, ValueError: Number of features of the model must match the input. 이런 경우를 방지하기위해 컬럼의 개수를 맞춰줘야하는데,아래와 같이 . reindex(columns =x_train.cloumns, fill_value=0 ) 를 수행해준다 x_train = pd.get_dummies(x_train)x_test = pd.get_dummies(x_test) x_test2 = x_.. 2024. 11. 13. predict 와 predict_proba 의 차이는 무엇인가? 안녕하세요, 오늘은 머신러닝 모델에서 예측을 수행할 때 사용하는 메서드인 predict와 predict_proba의 차이에 대하여 알아보겠습니다. predict와 predict_proba는 각각 반환하는 결과가 다릅니다. 1. predict:predict는 모델이 예측한 클래스 레이블을 반환합니다.주로 분류 문제에서 사용하며, 예측된 샘플이 특정 클래스에 속할 확률이 가장 높은 클래스로 결정됩니다.예를 들어, 이진 분류 문제에서 모델이 샘플을 클래스 0 또는 클래스 1로 예측할 때, predict는 최종 예측된 클래스 (0 또는 1)를 반환합니다. 2. predict_probapredict_proba는 각 클래스에 대한 확률을 반환합니다.예측한 각 클래스의 확률 값이 포함된 배열을 반환하며, 이진 분류 .. 2024. 11. 8. 이전 1 다음 반응형