Python分割训练集和测试集的方法示例
数据集介绍
使用数据集Wine,来自UCI 。包括178条样本,13个特征。
importpandasaspd
importnumpyasnp
df_wine=pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data',header=None)
df_wine.columns=['Classlabel','Alcohol',
'Malicacid','Ash',
'Alcalinityofash','Magnesium',
'Totalphenols','Flavanoids',
'Nonflavanoidphenols',
'Proanthocyanins',
'Colorintensity','Hue',
'OD280/OD315ofdilutedwines',
'Proline']
分割训练集和测试集
随机分割
分为训练集和测试集
方法:使用scikit-learn中model_selection子模块的train_test_split函数
fromsklearn.model_selectionimporttrain_test_split X,y=df_wine.ix[:,1:].values,df_wine.ix[:,0].values X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.25,random_state=0)#随机选择25%作为测试集,剩余作为训练集
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
热门推荐
10 八一幼儿祝福语大全简短
11 公司乔迁食堂祝福语简短
12 婚礼结束聚餐祝福语简短
13 儿媳买车妈妈祝福语简短
14 毕业送礼老师祝福语简短
15 同事辞职正常祝福语简短
16 恭贺新婚文案祝福语简短
17 金店立秋祝福语简短英文
18 婆婆高寿祝福语大全简短