scikit-learn에서 계층화 된 기차 / 테스트 분할 데이터를 훈련 세트 (75 %)와 테스트 세트 (25 %)로 분할해야합니다. 현재 아래 코드를 사용하여 수행합니다. X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo) 그러나 훈련 데이터 세트를 계층화하고 싶습니다. 어떻게하나요? 나는 StratifiedKFold방법을 조사해 왔지만 75 % / 25 % 분할을 지정하지 않고 훈련 데이터 세트 만 계층화하도록합니다. [0.17 업데이트] 문서 참조 sklearn.model_selection.train_test_split: from sklearn.model_selection import tra..