Python中文
首页
教程
问答
标签
搜索
登录
注册
使用一个文件在Python中搜索另一个文件中的行
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有两个文件:一个文件每行有一个单词,另一个文件有3个;它们如下所示:</p> <p>列表文件:</p> <pre><code>Gene1 Gene2 Gene3 Gene4 </code></pre> <p>主文件:</p> ^{pr2}$ <p>所以我想要的是使用列表文件来搜索和提取主文件中与列表匹配的行,并将它们写入第三个新文件中。因此,期望的输出是:</p> <p>新文件:</p> <pre><code>Gene8 Gene3 2.1 Gene1 Gene20 2.1 Gene3 Gene2 3.3 </code></pre> <p>我尝试过使用正则表达式搜索,但我似乎没有正确理解,因为它总是在匹配的情况下编写整个文档,而不是单个匹配行。在</p> <p>我尝试加载文件并将它们转换为字符串,并使用双for循环,但看起来它是逐字匹配的,这使得输出文件很难管理。在</p> <p>是的,我看到了帖子<a href="https://stackoverflow.com/questions/25291902/use-python-to-search-lines-of-file-for-list-entries/25292064#25292064">Use Python to search lines of file for list entries</a>,但我不能让它正常工作,结果文件还需要更多的格式化,使过程变得复杂,我似乎丢失了一些信息(列表文件有数千条条目,主文件有几十万行,所以不容易跟踪)。在</p> <p>我来找你,因为我知道应该有一个更高效、更简单的方法来做,因为它需要运行几次</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>将关键字列表加载到集合中:</p> <pre><code>keywords = set() with open(list_file_path) as list_file: for line in list_file: if line.strip(): keywords.add(line.strip()) </code></pre> <p>然后迭代主文件中的每一行,拉出至少包含一个关键字的行:</p> ^{pr2}$
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
4 回答
为什么在使用strptim时会出现这个datetime日期错误
3 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
7 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
5 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
9 回答
为什么在使用tabla时会得到一个空的数据帧?
9 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
3 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
7 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
8 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
4 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
8 回答
为什么在使用TextBlob时会出现HTTP错误?
8 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
8 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
3 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
10 回答
为什么在使用tkinter时不能使用复选框?
7 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
6 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
7 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
7 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
1 回答