본문 바로가기
반응형

OneHotEncoder2

OneHotEncoding시에 OneHotEncoding.fit()과 df.get_dummies()의 차이는? 안녕하세요, 오늘은 OneHotEncoding시에 사용하는 OneHotEncoding.fit()과 df.get_dummies()의 차이에 대하여 알아보겠습니다. OneHotEncoder와 pd.get_dummies()는 모두 데이터를 원-핫 인코딩하기 위한 도구지만, 용도와 세부적인 기능에서 차이가 있습니다.  1. 라이브러리와 사용 목적OneHotEncoder: scikit-learn의 OneHotEncoder는 주로 머신러닝 모델 학습에 필요한 데이터 전처리에서 사용됩니다. 이를 통해 변환한 데이터를 바로 scikit-learn 모델에 사용할 수 있는 형식으로 만들어 줍니다.pd.get_dummies: pandas의 get_dummies()는 주로 데이터프레임에서 범주형 데이터를 쉽게 인코딩하기 위해.. 2024. 11. 7.
LabelEncoder와 OneHotEncoder의 차이는 무엇일까? 안녕하세요, 오늘은 LabelEncoder와 OneHotEncoder의 차이에 대하여 알아보겠습니다. LabelEncoder와 OneHotEncoder는 모두 범주형(object) 데이터를 수치형 데이터로 변환할 때 사용하는 인코딩 도구지만,사용 용도가 약간 다릅니다. 1. LabelEncoder개요 - LabelEncoder는 범주형 데이터의 각 값을 고유한 숫자(Label)로 변환합니다. 예를 들어, 'Red', 'Blue', 'Green'이라는 세 개의 카테고리가 있으면, 각각 0, 1, 2로 인코딩됩니다. 사용 용도 - 데이터의 카테고리 간에 순서가 있거나, 특정한 모델(예: 트리 기반 모델)에서는 숫자 자체가 의미를 가지지 않기 때문에, 고유한 숫자만 있으면 되는 경우 사용합니다. 예시 -'소형.. 2024. 11. 5.
반응형

loading