Python中文
首页
教程
问答
标签
搜索
登录
注册
提取单词uptill特定符号
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<div> </div> <p>嗨,我有这个uniprot gff数据</p> <pre><code>+--------+--------+-------+------+------------------------------------------------------------------------------------------------------+ | Entry | check | start | end | Domains | +--------+--------+-------+------+------------------------------------------------------------------------------------------------------+ | O75581 | Repeat | 63 | 106 | Note=LDL-receptor class B 1 | | O75581 | Repeat | 150 | 193 | Note=LDL-receptor class B 3 | | O75581 | Domain | 282 | 324 | Note=EGF-like 1 | | O75581 | Domain | 1248 | 1286 | Note=LDL-receptor class A 1;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00124 | | O75581 | Domain | 1287 | 1323 | Note=LDL-receptor class A 2;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00124 | | O75581 | Domain | 1325 | 1361 | Note=LDL-receptor class A 3;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00124 | | P13688 | Domain | 35 | 142 | Note=Ig-like V-type;Ontology_term=ECO:0000250;evidence=ECO:0000250|UniProtKB:P31997 | | P13688 | Domain | 145 | 232 | Note=Ig-like C2-type 1;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00114 | | P13688 | Domain | 237 | 317 | Note=Ig-like C2-type 2;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00114 | | P13688 | Domain | 323 | 413 | Note=Ig-like C2-type 3;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00114 | | P19022 | Domain | 160 | 267 | Note=Cadherin 1;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00043 | | P19022 | Domain | 268 | 382 | Note=Cadherin 2;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00043 | | P19022 | Domain | 383 | 497 | Note=Cadherin 3;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00043 | | Q13586 | Domain | 132 | 200 | Note=SAM;Ontology_term=ECO:0000255;evidence=ECO:0000255|PROSITE-ProRule:PRU00184 | | P04629 | Repeat | 90 | 113 | Note=LRR 1 | | P04629 | Repeat | 116 | 137 | Note=LRR 2 | +--------+--------+-------+------+------------------------------------------------------------------------------------------------------+ </code></pre> <p>我正在尝试提取域名列<code>df['Domains]</code>。使用下面的代码,我很快就能得到域名的前23个单词,但并不普遍有效</p> <pre><code>for row in df['Domains']: print(re.findall(r'Note=(\w*)(.?)(\w*)', row)) </code></pre> <p>这样的话</p> <pre><code>[('LDL', '-', 'receptor')] [('LDL', '-', 'receptor')] [('EGF', '-', 'like')] [('Ig', '-', 'like')] [('Ig', '-', 'like')]` </code></pre> <p>所以,我希望改变我的方法,让一切在<code>Note=</code>之后开始,在<code>;</code>之前结束,或者在行尾结束。我怎样才能得到这个</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<pre><code>for row in df['Domains']: phrase = re.findall('.*;', row) if len(phrase) > 0: print(phrase[0]) else: print(row) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
1 回答
无法使用Django\u mssql\u后端迁移到外部hos
3 回答
无法使用Django&Python3.4连接到MySql
1 回答
无法使用Django+nginx上载媒体文件
6 回答
无法使用Django1.6导入名称模式
5 回答
无法使用Django1.7和mongodb登录管理站点
7 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
9 回答
无法使用Djangockedi验证CBV中的字段
1 回答
无法使用Djangocketditor上载图像(错误400)
7 回答
无法使用Djangocron进行函数调用
8 回答
无法使用Djangofiler djang上载文件
10 回答
无法使用Djangokronos
8 回答
无法使用Djangomssql provid
2 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
10 回答
无法使用Djangomssq迁移Django数据库
7 回答
无法使用Djangonox创建用户
2 回答
无法使用Djangopyodb从Django查询SQL Server
10 回答
无法使用Djangopython3ldap连接到ldap
7 回答
无法使用Djangoredis连接到redis
10 回答
无法使用Django中的FK创建新表
7 回答