Python中文
首页
教程
问答
标签
搜索
登录
注册
从在线.txt文件中仅下载某些行
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>基因组注释存储在大的纯文本文件中,例如<a href="https://www.ebi.ac.uk/ena/data/view/FO203355&display=textc" rel="nofollow noreferrer">https://www.ebi.ac.uk/ena/data/view/FO203355&display=textc</a></p> <p>我只想提取以“FT”开头的行。因为我需要提取成千上万个文件的“FT”,所以下载整个文件并手动提取所需行是不可行的</p> <p>是否有任何终端或python构造可以做到这一点?我最终想要创建一个大型(python)数据帧</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你可以使用curl和grep。您仍然需要下载整个文件,除非ebi.ac.uk服务器api提供服务器端过滤</p> <pre><code>curl 'https://www.ebi.ac.uk/ena/data/view/FO203355&display=text' | grep '^FT' > lines.txt </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
(编辑)背景2+均值漂移跟踪?
7 回答
(网络爬虫)如何从新闻网站获取新闻段落的文本
5 回答
(置换)列表的唯一组合
1 回答
(美丽的soap4,)AttributeError:“非类型”对象没有属性“获取文本”
6 回答
(聊天室)使用套接字通常只允许一个地址(协议/网络地址/端口)
10 回答
(自动)在Pycharm/Python中的=后缩进
3 回答
(自动Py到Exe和Python)找不到“googleapipythonclient”发行版,该发行版是应用程序所必需的
1 回答
(自动操作)write()和do for循环的Odoo问题
1 回答
(自定义)百分位MSE损失函数
1 回答
(自定义用户)createsuperuser TypeError:hasattr():属性名必须是字符串
2 回答
(节点)警告:检测到可能的EventEmitter内存泄漏。添加了11个消息侦听器。使用emitter.setMaxListeners()增加limi
6 回答
(若变量中有字符串)语句未筛选出数据
10 回答
(英语、Perl、Python、Ruby)在代码片段的基础上进行比较?
10 回答
(范围(1,36),7)和+条件下的所有组合
3 回答
(范围(3),范围(3))值错误:要解压缩的值太多(预期为2)
8 回答
(蟒蛇) 平均分配数字
1 回答
(行、列):数据帧的值
9 回答
(行、列)形式的最小值
1 回答
(解决)导入PYBID11/C++编译模块不工作
1 回答
(记忆有效)将“排序”作为生成器实现
6 回答