Python 实现训练集、测试集随机划分
随机从列表中取出元素:
importrandom dataSet=[[0],[1],[2],[3],[4],[5],[6],[7],[8],[9],[10]] trainDataSet=random.sample(dataSet,3)
以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:
importcsv
importrandom
defgetDataSet(proportion):
"""
:exception
获取训练集和测试集(将数据按比例随机划分)
:parameter
proportion-测试集/数据集
:return
trainDataSet-训练集
testDataSet-测试集
author
肖政宇
modify
2019年5月10日
"""
dataSet=open('数据集.csv')
dataSetReader=csv.reader(dataSet)
"""
:exception
将数据保存到数组
"""
dataSet=[]
next(dataSetReader,'none')#跳过表头
data=next(dataSetReader,'none')
while(data!='none'):
dataSet.append(data)
data=next(dataSetReader,'none')
"""
:exception
按照比例随机划分出训练集和测试集
"""
dataNumber=dataSet.__len__()#数据集数据条数
testNumber=int(dataNumber*proportion)#测试集数据条数
testDataSet=[]#测试数据集
trainDataSet=[]#训练数据集
testDataSet=random.sample(dataSet,testNumber)#测试集
fortestDataintestDataSet:#将已经选定的测试集数据从数据集中删除
dataSet.remove(testData)
trainDataSet=dataSet#训练集
returntrainDataSet,testDataSet
以上这篇Python实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。