반응형 OneHotEncoding2 빅분기_실기_OneHotEncoding후 predict()할때 발생하는 오류 OneHotEncoding을 할 때 pd.get_dummies()를 자주 쓰게 되는데 train에는 있고 test에는 없는 컬럼값이 있을 수 있다.그렇게 get_dummies()를 수행하면 컬럼의 개수가 달라져서 차후에 모델에 predict()를 할때 다음과 같은 오류가 발생한다, ValueError: Number of features of the model must match the input. 이런 경우를 방지하기위해 컬럼의 개수를 맞춰줘야하는데,아래와 같이 . reindex(columns =x_train.cloumns, fill_value=0 ) 를 수행해준다 x_train = pd.get_dummies(x_train)x_test = pd.get_dummies(x_test) x_test2 = x_.. 2024. 11. 13. OneHotEncoding시에 OneHotEncoding.fit()과 df.get_dummies()의 차이는? 안녕하세요, 오늘은 OneHotEncoding시에 사용하는 OneHotEncoding.fit()과 df.get_dummies()의 차이에 대하여 알아보겠습니다. OneHotEncoder와 pd.get_dummies()는 모두 데이터를 원-핫 인코딩하기 위한 도구지만, 용도와 세부적인 기능에서 차이가 있습니다. 1. 라이브러리와 사용 목적OneHotEncoder: scikit-learn의 OneHotEncoder는 주로 머신러닝 모델 학습에 필요한 데이터 전처리에서 사용됩니다. 이를 통해 변환한 데이터를 바로 scikit-learn 모델에 사용할 수 있는 형식으로 만들어 줍니다.pd.get_dummies: pandas의 get_dummies()는 주로 데이터프레임에서 범주형 데이터를 쉽게 인코딩하기 위해.. 2024. 11. 7. 이전 1 다음 반응형