BigData
빅분기_실기_OneHotEncoding후 predict()할때 발생하는 오류
Lcoding
2024. 11. 13. 00:45
반응형
OneHotEncoding을 할 때 pd.get_dummies()를 자주 쓰게 되는데 train에는 있고 test에는 없는 컬럼값이 있을 수 있다.
그렇게 get_dummies()를 수행하면 컬럼의 개수가 달라져서 차후에 모델에 predict()를 할때 다음과 같은 오류가 발생한다,
ValueError: Number of features of the model must match the input.
이런 경우를 방지하기위해 컬럼의 개수를 맞춰줘야하는데,
아래와 같이 . reindex(columns =x_train.cloumns, fill_value=0 ) 를 수행해준다
x_train = pd.get_dummies(x_train)
x_test = pd.get_dummies(x_test)
x_test2 = x_test.reindex(columns =x_train.cloumns, fill_value=0)
반응형