从HTML页面Python获取带有特定关键字的<li>

<li><a href="/wiki/February_21" title="February 21">February 21</a> – WWI: The <a href="/wiki/Battle_of_Verdun" title="Battle of Verdun">Battle of Verdun</a> begins in <a href="/wiki/French_Third_Republic" title="French Third Republic">France</a>.</li>

2条回答

网友

1楼 · 编辑于 2024-05-17 06:35:45

你可以这样做

soup = BeautifulSoup(html)
print([i for i in soup.select('li') if 'verdun' in i])

网友

2楼 · 编辑于 2024-05-17 06:35:45

BeautifulSoup允许您通过部分文本进行搜索。只需执行以下操作：

import re
soup = BeautifulSoup(html)
lis = soup.find_all('li', text=re.compile('verdun'))

# Now the lis contain a ResultSet (list) of all li tags with 'verdun' as text
for li in lis:
    print li.text

编程相关推荐

java Intellij通过方法中的包查找用法
java中VS代码和打包命名的问题
将java CMS功能集成到具有高度动态内容的网站（Lucene/Mysql/Nosql）的策略
oracle的java类强制转换异常。jdbc。驾驶员OracleConnection
字节码向JVM添加上指令
如何在抽象类中执行java方法？
java是否可以在apache访问日志中排除指定的GET参数？（作者：W7开发环境）
java如何获取已安装音频播放器的列表？
尝试向HS学生展示如何使用Java访问MS数据库
使用正则表达式java对给定行中的特定字符串进行计数

相关问题更多 >

编程相关推荐

热门问题

热门文章

从HTML页面Python获取带有特定关键字的<li>

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >