반응형 random_state1 train_test_split의 파라미터에서 stratify는 언제 사용할까? 안녕하세요,오늘은 모델의 성능을 평가하기 위해 훈련 데이터와 테스트 데이터를 분할하는 데 사용되는 함수인train_test_split()와 그 파라미터인 stratify에 대하여 알아보겠습니다. train_test_split란?데이터셋을 train 데이터와 test 데이터로 분할하는 데 사용되는 함수입니다.주로 모델의 성능을 평가하기 위해 데이터를 나눌 때 사용하며 Python의 머신러닝 라이브러리인 Scikit-Learn에서 제공됩니다. - 주요 목적train 데이터는 모델을 학습시키기 위해 사용하고, test 데이터는 학습된 모델이 새로운 데이터에 대해 얼마나 잘 일반화되는지 평가하기 위해 사용합니다.데이터를 훈련과 테스트로 분리하면, train 데이터에만 최적화된 모델이 되는 것을 방지하고 새로운 .. 2024. 11. 1. 이전 1 다음 반응형