Python中文
首页
教程
问答
标签
搜索
登录
注册
在python中迭代和匹配大文件
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有两个大文本文件:</p> <p>“>;600000行的字母”</p> <p>“数字”大于100 000行</p> <p>字母如下所示:</p> <pre><code>AAAA AAAB AAAC etc… </code></pre> <p>数字有两列,一列是“id”,另一列是数字列表:</p> <pre> id1 5, 201, 66, 33 id2 356 <b>id3</b> 5103, <b>2</b>, 452 etc… </pre> <p>我希望“字母”中的每一行代表一个数字:</p> <pre> 1 AAAA <b>2</b> <b>AAAB</b> etc… </pre> <p>然后检查“数字”中的哪一行包含该数字,然后将该id与字母组合配对,仅在本例中:</p> <pre><code>AAAB id3 </code></pre> <p>运行此脚本需要几天时间:</p> <pre><code>combine = {} for i, x in enumerate(letters): for id, number in numbers.items(): if i+1 in number: combine[x['letter']] = id </code></pre> <p>有没有更快的方法?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>只需对每个文件进行一次传递,O(N):</p> <ol> <li><p>将字母文件读入数组。您将获得数组索引(+1?)=行号。</p></li> <li><p>读取数字文件。对于每行:使用数字将<code>id</code>与数组中的字母组合。</p></li> </ol>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
4 回答
无法使用Django\u mssql\u后端迁移到外部hos
5 回答
无法使用Django&Python3.4连接到MySql
2 回答
无法使用Django+nginx上载媒体文件
3 回答
无法使用Django1.6导入名称模式
8 回答
无法使用Django1.7和mongodb登录管理站点
9 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
10 回答
无法使用Djangockedi验证CBV中的字段
8 回答
无法使用Djangocketditor上载图像(错误400)
3 回答
无法使用Djangocron进行函数调用
4 回答
无法使用Djangofiler djang上载文件
4 回答
无法使用Djangokronos
8 回答
无法使用Djangomssql provid
2 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
4 回答
无法使用Djangomssq迁移Django数据库
3 回答
无法使用Djangonox创建用户
8 回答
无法使用Djangopyodb从Django查询SQL Server
5 回答
无法使用Djangopython3ldap连接到ldap
8 回答
无法使用Djangoredis连接到redis
1 回答
无法使用Django中的FK创建新表
1 回答