Holdout metode i python

stemmer
0

Hvordan gjøre 6: 4 hjemmested i python? Jeg prøvde følgende kode:

X_train, X_test, y_train, y_test =  train_test_split(X,y, training_size=0.6, test_size=0.4)

Men ikke sikker på om det er riktig eller ikke.

Publisert på 09/10/2019 klokken 11:55
kilden bruker
På andre språk...                            


1 svar

stemmer
2

Se i dokumentasjonen for train_test_splitfra scikit-lære.

Slik stiller både størrelsen på trening og testsettet du må passere train_size(ikke training_sizesom i koden) og test_size.

For å bruke 60% av dine data for opplæring og 40% for testing du kan bruke denne:

import numpy as np
from sklearn.model_selection import train_test_split

X = np.random.rand(100, 2)
y = range(100)

X_train, X_test, y_train, y_test = train_test_split(X, y, train_size=0.6, test_size=0.4)

Du kan bekrefte at for de 100 datapunkter som brukes i dette eksemplet du får et togsett størrelse på 60 og et testsett på 40:

print(len(X_train), len(X_test))
print(len(y_train), len(y_test))
> 60 40
> 60 40
Svarte 09/10/2019 kl. 12:53
kilden bruker

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more