반응형 전체 글211 train_test_split의 파라미터에서 stratify는 언제 사용할까? 안녕하세요,오늘은 모델의 성능을 평가하기 위해 훈련 데이터와 테스트 데이터를 분할하는 데 사용되는 함수인train_test_split()와 그 파라미터인 stratify에 대하여 알아보겠습니다. train_test_split란?데이터셋을 train 데이터와 test 데이터로 분할하는 데 사용되는 함수입니다.주로 모델의 성능을 평가하기 위해 데이터를 나눌 때 사용하며 Python의 머신러닝 라이브러리인 Scikit-Learn에서 제공됩니다. - 주요 목적train 데이터는 모델을 학습시키기 위해 사용하고, test 데이터는 학습된 모델이 새로운 데이터에 대해 얼마나 잘 일반화되는지 평가하기 위해 사용합니다.데이터를 훈련과 테스트로 분리하면, train 데이터에만 최적화된 모델이 되는 것을 방지하고 새로운 .. 2024. 11. 1. roc_curve와 roc_auc_score는 각각 언제 사용할까? 안녕하세요, 오늘은 모델 성능평가와 관련하여 roc_curve와 roc_auc_score의 차이에 대하여 알아보겠습니다. roc_curve와 roc_auc_score는 둘 다 분류 모델의 성능을 평가하는 데 사용되지만, 서로 다른 정보를 제공합니다. 이 둘의 사용처와 역할을 비교하면 다음과 같습니다. 1. roc_curve정의: roc_curve는 다양한 분류 임곗값(threshold)에 대해 **True Positive Rate (TPR, 재현율)**와 **False Positive Rate (FPR)**를 계산하여 ROC (Receiver Operating Characteristic) 곡선을 생성하는 함수입니다. 사용처:모델의 성능을 시각적으로 평가하고 싶을 때 유용합니다.임곗값에 따라 TPR과 F.. 2024. 10. 31. MinMaxScaler과 StandardScaler는 언제 사용할까? 안녕하세요, 오늘은 수치형 스케일러인 MinMaxScaler와 StandardScaler에 대하여 알아보겠습니다. MinMaxScaler와 StandardScaler는 데이터의 스케일을 조정해주는 두 가지 대표적인 방법으로, 데이터의 특성과 분석 목적에 따라 선택적으로 사용됩니다. 1. MinMaxScaler특징: 데이터의 최소값을 0, 최대값을 1로 변환해 모든 값이 0에서 1 사이에 위치하도록 스케일링합니다.장점: 값이 일정한 범위 내에 존재하게 되므로 특정 값 범위가 필요한 알고리즘(예: 이미지 처리를 위한 신경망)이나 거리 기반 알고리즘(예: K-Nearest Neighbors)에서 유용합니다.사용처:데이터의 분포가 특정 범위 안에 있도록 제약해야 하는 경우.최대값과 최소값의 차이가 큰 변수를 사.. 2024. 10. 30. 유니캐스트, 브로드캐스트, 멀티캐스트, 애니캐스트의 차이점 1. 유니캐스트, 브로드캐스트, 멀티캐스트, 애니캐스트의 차이점에 대하여 간단히 표로 알아보겠습니다. 구분유니캐스트(Unicast) 브로드캐스트(Broadcast) 멀티캐스트(Multicast) 애니캐스트(Anycast)설명한 대의 송신자가 한 대의 수신자에게 데이터 전송한 대의 송신자가 네트워크의 모든 노드에게 데이터 전송한 대의 송신자가 특정 그룹의 다수 수신자에게 데이터 전송한 대의 송신자가 여러 수신자 중 가장 가까운 수신자에게 전송통신 방식1:1 1:전체1:그룹1:가장 가까운 1개 수신자IPv4 주소단일 유니캐스트 주소 (예: 192.168.1.1) 브로드캐스트 주소 (255.255.255.255) 멀티캐스트 주소 (224.0.0.0 ~ 239.255.255.255) 유니캐스트 주소 형식을 사용.. 2024. 9. 26. 데이터분석 준전문가(ADsP) 자격증 후기 문과-학원 출신이라통계쪽 관련 지식은 전혀없고 백엔드 개발직무 하고있습니다.기존에 취득한 자격증은 리눅스마스터2급, sqld, 정보처리기사 있습니다.하루 2시간씩 3주정도 공부했고 교재는 데이터에듀(민트책)이론 1회독, 문제 2회독+유튜브(아답터-민기술사) 전체 1회 + 필요한부분 추가로시청했습니다. 데이터에듀 교재를 구입하게되면 데이터에듀pt라는 모바일웹을 사용할 수 있게되어 핸드폰만 있다면 언제 어디서든 문제를 풀어볼 수 있어서 회사에서 틈날때나 화장실 갔을때,출퇴근길에 틈틈히 문제풀이 및 해설 공부를 했습니다.어플 구조는 아래 이미지 참고하시기 바랍니다! 2024. 9. 13. adsp 1과목 정리 adsp 1과목 정리 - 정성데이터텍스트로 표현(문과적) 정량데이터숫자로 표현(이과적) 암묵지(혼자만 알고 있는 것)와 형식지(책등 공유) 상호작용관계는?공통화(암묵지를 타인과 공유한다) ->표출화(책등의 형식지로 만든다) ->연결화(책등에 자신이 아는 새로운 지식 추가) ->내면화(책등을 보고 타인들이 암묵적 지식 습득) 정형 데이터- 구조화 가능반정형 데이터- 메타데이터가 있음비정형 데이터- 구조화 불가능 , 텍스트,이미지,오디오,비디오등 다양한 형태 DIKW 피라미드지혜(wisdom) 다른 물건도 B가 더 비쌀 것이다.지식(knowledge) 상대적으로 저렴한 A에서 사야겠다.정보(information) A보다 B가 비싸다.데이터(data) USB를 A는 50원 B는 100원에 판다. DW의 경우 .. 2024. 7. 24. 이전 1 ··· 8 9 10 11 12 13 14 ··· 36 다음 반응형