Python中文
首页
教程
问答
标签
搜索
登录
注册
删除重复项:python结果与sort u不同
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个很长的文本文件(2GB),我删除了重复使用:</p> <pre><code>sort -u filename > outfile1 </code></pre> <p>以及</p> <pre><code>>>> data = open('filename', 'r').readlines() >>> u = list(set(data)) >>> open('outfile2', 'w').writelines(u) </code></pre> <p>但是,两个文件outfile2和outfile1的条目数不同:</p> <pre><code>wc -l outfile? 185866729 filename 109608242 outfile1 109611085 outfile2 </code></pre> <p>这怎么可能?你知道吗</p> <p>更新。 在请求查看数据之后,我发现python将删除重复项,如:</p> <pre><code> låsningernes læsningernes løsningernes </code></pre> <p>实际上,在<code>sort -u</code>中忽略第二个字符,只保留第一个条目。Python在区分这三条记录方面做得很好。你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>如果将它们合并并创建为一个列表,则可以执行以下操作:</p> <pre><code>non_duplicates= [a for i,a in enumerate(l) if i == l.index(a)] </code></pre> <p>这也保持了它包含的项目的顺序</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何合并多个PDF文件?
4 回答
如何合并多个xarray数据变量及其坐标?
3 回答
如何合并多个列中具有重复值的行
5 回答
如何合并多个唯一id
9 回答
如何合并多个图纸并使用图纸名称的名称重命名列名?
7 回答
如何合并多个字典并添加同一个键的值?(Python)
5 回答
如何合并多个搜索结果文件(pkl)以将它们全部打印在一起?
10 回答
如何合并多个数据帧
4 回答
如何合并多个数据帧并使用Pandas为假人添加列?
2 回答
如何合并多个数据帧并按时间戳排序
8 回答
如何合并多个数据帧的列表并用另一个lis标记每列
4 回答
如何合并多个数据框中的列
4 回答
如何合并多个文件?
6 回答
如何合并多个查询集?
3 回答
如何合并多个绘图?
7 回答
如何合并多个词典
6 回答
如何合并多个输入数据集(数据帧)?
4 回答
如何合并多条记录中拆分的文本行
2 回答
如何合并多索引列datafram
8 回答
如何合并多级(即多索引)数据帧?
7 回答