Python中文
首页
教程
问答
标签
搜索
登录
注册
如何将数据随机分为训练集和测试集?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个大的数据集,想把它分成训练集(50%)和测试集(50%)。</p> <p>假设我有100个示例存储在输入文件中,每行包含一个示例。我需要选择50行作为训练集和50行测试集。</p> <p>我的想法是首先生成一个长度为100的随机列表(值范围从1到100),然后使用前50个元素作为50个训练示例的行号。测试集也一样。</p> <p>这在Matlab中很容易实现</p> <pre><code>fid=fopen(datafile); C = textscan(fid, '%s','delimiter', '\n'); plist=randperm(100); for i=1:50 trainstring = C{plist(i)}; fprintf(train_file,trainstring); end for i=51:100 teststring = C{plist(i)}; fprintf(test_file,teststring); end </code></pre> <p>但是我怎样才能用Python完成这个功能呢?我是Python新手,不知道是否可以将整个文件读入数组,并选择某些行。</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>在Python中,这可以类似地使用列表来实现(注意,整个列表都在适当的位置进行了洗牌)。</p> <pre><code>import random with open("datafile.txt", "rb") as f: data = f.read().split('\n') random.shuffle(data) train_data = data[:50] test_data = data[50:] </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在Excel中读取公式并将其转换为Python中的计算?
6 回答
如何在excel中读取嵌入的excel,并将嵌入文件中的信息存储在主excel文件中?
9 回答
如何在Excel中返回未知列长度的非空顶行列值?
9 回答
如何在excel中选择数据列?
1 回答
如何在Excel中通过脚本自动为一列中的所有单元格创建公共别名
7 回答
如何在excel中高效格式化范围AttributeError:“tuple”对象没有属性“fill”
2 回答
如何在excel单元格中编写python函数
9 回答
如何在excel单元格中自动执行此python代码?
3 回答
如何在excel工作表中创建具有相应值的新列
6 回答
如何在Excel工作表中复制条件为单元格颜色的python数据框?
2 回答
如何在Excel工作表中循环
9 回答
如何在excel工作表中打印嵌套词典?
3 回答
如何在excel工作表中绘制所有类的继承树?
4 回答
如何在Excel工作表中自动调整列宽?
2 回答
如何在excel工作表中追加并进一步处理
2 回答
如何在excel工作表之间进行更改?
5 回答
如何在excel或csv上获取selenium数据?
6 回答
如何在Excel或Python中将正确的值赋给正确的列
3 回答
如何在excel或python中提取单词周围的文本?
10 回答
如何在excel或python中转换来自Jira的3w 1d 4h的fromat数据?
9 回答