본문 바로가기
반응형

티스토리챌린지21

ETL이란 무엇인가? 안녕하세요, 오늘은 ETL(Extract, Transform, Load)에 대하여 알아보겠습니다. 1. ETL 이란?ETL(Extract, Transform, Load)은 데이터를 DW나 DM에 적재하기 위해 거치는 과정으로, 각 단계를 좀 더 상세하게 설명하면 다음과 같습니다.1. 추출 (Extract)추출 단계에서는 데이터를 여러 원천 시스템에서 가져옵니다. 원천 데이터는 보통 다양한 형식과 구조로 존재하며, 예를 들어 관계형 데이터베이스, 로그 파일, 웹 애플리케이션, API, 또는 IoT 센서에서 생성된 데이터 등을 포함할 수 있습니다. 작업 내용:각 원천 시스템에 접근해 데이터를 가져오며, 이 때 SQL 쿼리, API 요청, 파일 읽기 등이 사용됩니다.실시간 또는 일정 주기에 맞춰 데이터를 가져.. 2024. 11. 9.
predict 와 predict_proba 의 차이는 무엇인가? 안녕하세요, 오늘은 머신러닝 모델에서 예측을 수행할 때 사용하는 메서드인 predict와 predict_proba의 차이에 대하여 알아보겠습니다. predict와 predict_proba는 각각 반환하는 결과가 다릅니다. 1. predict:predict는 모델이 예측한 클래스 레이블을 반환합니다.주로 분류 문제에서 사용하며, 예측된 샘플이 특정 클래스에 속할 확률이 가장 높은 클래스로 결정됩니다.예를 들어, 이진 분류 문제에서 모델이 샘플을 클래스 0 또는 클래스 1로 예측할 때, predict는 최종 예측된 클래스 (0 또는 1)를 반환합니다. 2. predict_probapredict_proba는 각 클래스에 대한 확률을 반환합니다.예측한 각 클래스의 확률 값이 포함된 배열을 반환하며, 이진 분류 .. 2024. 11. 8.
OneHotEncoding시에 OneHotEncoding.fit()과 df.get_dummies()의 차이는? 안녕하세요, 오늘은 OneHotEncoding시에 사용하는 OneHotEncoding.fit()과 df.get_dummies()의 차이에 대하여 알아보겠습니다. OneHotEncoder와 pd.get_dummies()는 모두 데이터를 원-핫 인코딩하기 위한 도구지만, 용도와 세부적인 기능에서 차이가 있습니다.  1. 라이브러리와 사용 목적OneHotEncoder: scikit-learn의 OneHotEncoder는 주로 머신러닝 모델 학습에 필요한 데이터 전처리에서 사용됩니다. 이를 통해 변환한 데이터를 바로 scikit-learn 모델에 사용할 수 있는 형식으로 만들어 줍니다.pd.get_dummies: pandas의 get_dummies()는 주로 데이터프레임에서 범주형 데이터를 쉽게 인코딩하기 위해.. 2024. 11. 7.
반응형

# 로딩 화면 동작 코드(Code) 설정하기
loading