Python 实现训练集、测试集随机划分
随机从列表中取出元素:
importrandom dataSet=[[0],[1],[2],[3],[4],[5],[6],[7],[8],[9],[10]] trainDataSet=random.sample(dataSet,3)
以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:
importcsv importrandom defgetDataSet(proportion): """ :exception 获取训练集和测试集(将数据按比例随机划分) :parameter proportion-测试集/数据集 :return trainDataSet-训练集 testDataSet-测试集 author 肖政宇 modify 2019年5月10日 """ dataSet=open('数据集.csv') dataSetReader=csv.reader(dataSet) """ :exception 将数据保存到数组 """ dataSet=[] next(dataSetReader,'none')#跳过表头 data=next(dataSetReader,'none') while(data!='none'): dataSet.append(data) data=next(dataSetReader,'none') """ :exception 按照比例随机划分出训练集和测试集 """ dataNumber=dataSet.__len__()#数据集数据条数 testNumber=int(dataNumber*proportion)#测试集数据条数 testDataSet=[]#测试数据集 trainDataSet=[]#训练数据集 testDataSet=random.sample(dataSet,testNumber)#测试集 fortestDataintestDataSet:#将已经选定的测试集数据从数据集中删除 dataSet.remove(testData) trainDataSet=dataSet#训练集 returntrainDataSet,testDataSet
以上这篇Python实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。