根据位置筛选字符串成列表 - Python - 问答

2条回答

网友

1楼 · 编辑于 2024-10-02 22:31:17

使用regex解析HTML肯定是limited，但是如果您想获得真正的HTML挖掘解决方案，请尝试查看这个插件BeautifulSoup。你知道吗

至于regex，asterisk量词是贪心的，它会一直吃到</p>的最后一个。所以，您应该使用(?=XXX)命令，这意味着搜索直到XXX找到。你知道吗

请尝试以下操作：你知道吗

re.findall(r'<p>(.*?)(?=</p>)', s)

网友

2楼 · 编辑于 2024-10-02 22:31:17

是否要删除html文本中的所有标记？我不会选择正则表达式，最好选择另一种方法，例如使用BeautifulSoup，你会在那次黑客会议上大吃一惊：

from bs4 import BeautifulSoup

myString = "<html><body><p>Hello World!</p><p>Hello Dennis!</p></body></html>"

myList = list(BeautifulSoup(myString).strings))

它产生：

['Hello World!', 'Hello Dennis!']

编程相关推荐

java DB2查看最近执行的命令
java正则表达式如何只匹配数字后的字符，而不在匹配模式中包含数字
java是否可以使用Jmh运行基于时间的预热阶段？
java必须输入两次输入，扫描仪才能读取
java如何使用一个或多个类方法设置多个类字段，而这些类方法并不专门引用任何字段？
java Quartz的CronTrigger每24小时一次，如午夜
java字符串索引超出边界异常？
java FXMLLoader找不到fxml文件Maven项目
java Eclipse Indigo在安装m2ewtp插件时遇到问题
java如何为连接池配置Hibernate、Spring和ApacheDBCP？

根据位置筛选字符串成列表 - Python

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据位置筛选字符串成列表 - Python

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >