Python中文
首页
教程
问答
标签
搜索
登录
注册
如何在python中基于条件提取文本
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我的汤数据如下</p> <pre><code><a href="/title/tt0110912/" title="Quentin Tarantino"> Pulp Fiction </a> <a href="/title/tt0137523/" title="David Fincher"> Fight Club </a> <a href="blablabla" title="Yet to Release"> Yet to Release </a> <a href="something" title="Movies"> Coming soon </a> </code></pre> <p>我需要来自那些<code>a</code>标记的文本数据,条件可能是<code>href=/title/*wildcharacter*</code></p> <p>我的眼睛可能有点像这样</p> <pre><code>titles = [] for a in soup.find_all("a",href=True): if a.text: titles.append(a.text.replace('\n'," ")) print(titles) </code></pre> <p>但是在这个条件下,我从所有<code>a</code>标记中获取文本。我只需要<code>href</code>有<code>"/title/***"</code>的文本</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以使用正则表达式搜索属性的内容(在本例中为href)</p> <p>有关更多详细信息,请参阅以下答案:<a href="https://stackoverflow.com/a/47091570/1426630">https://stackoverflow.com/a/47091570/1426630</a></p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
1 回答
无法使用Django\u mssql\u后端迁移到外部hos
7 回答
无法使用Django&Python3.4连接到MySql
6 回答
无法使用Django+nginx上载媒体文件
7 回答
无法使用Django1.6导入名称模式
1 回答
无法使用Django1.7和mongodb登录管理站点
1 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
5 回答
无法使用Djangockedi验证CBV中的字段
1 回答
无法使用Djangocketditor上载图像(错误400)
5 回答
无法使用Djangocron进行函数调用
3 回答
无法使用Djangofiler djang上载文件
10 回答
无法使用Djangokronos
2 回答
无法使用Djangomssql provid
2 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
4 回答
无法使用Djangomssq迁移Django数据库
3 回答
无法使用Djangonox创建用户
4 回答
无法使用Djangopyodb从Django查询SQL Server
9 回答
无法使用Djangopython3ldap连接到ldap
8 回答
无法使用Djangoredis连接到redis
8 回答
无法使用Django中的FK创建新表
6 回答