본문 바로가기
BigData

빅분기_실기_OneHotEncoding후 predict()할때 발생하는 오류

by Lcoding 2024. 11. 13.
반응형
 

OneHotEncoding을 할 때 pd.get_dummies()를 자주 쓰게 되는데 train에는 있고 test에는 없는 컬럼값이 있을 수 있다.

그렇게 get_dummies()를 수행하면 컬럼의 개수가 달라져서 차후에 모델에 predict()를 할때 다음과 같은 오류가 발생한다,

 

ValueError: Number of features of the model must match the input.

 

이런 경우를 방지하기위해 컬럼의 개수를 맞춰줘야하는데,

아래와 같이 . reindex(columns =x_train.cloumns, fill_value=0 ) 를 수행해준다

 

 

x_train = pd.get_dummies(x_train)

x_test = pd.get_dummies(x_test)

 

x_test2 = x_test.reindex(columns =x_train.cloumns, fill_value=0)

반응형

# 로딩 화면 동작 코드(Code) 설정하기
loading