使用lxm在python中提取段落

2024-10-01 04:50:56 发布

男 | 程序猿一只，喜欢编程写python代码。

我想用python提取html中的段落。我使用了lxml模块，但它并不能完全满足我的需要。在

print html.parse(url).xpath('//p')[1].text_content()

<span id="midArticle_1"></span><p>Here is the First Paragraph.</p><span id="midArticle_2"></span><p>Here is the second Paragraph.</p><span id="midArticle_3"></span><p>Paragraph Three."</p>

我要补充的是，在不同的页数我有不同的段落数，所以想列一个列表，然后把段落放进去。在

Tags：模块 the id url here parse is html

1条回答

网友

1楼 · 发布于 2024-10-01 04:50:56

print html.parse(url).xpath('//p/text()')

输出

^{pr2}$

编程相关推荐

swing Java：使用带有箭头键的按键
JavaApache意外暂停以发出请求
Java通用方法。为什么T被推断为地图？
java SpringBootMavenPlugin命令将资源复制到WAR主目录
在创建对象之前使用的oop Java括号
java如何让GELFJ appender在log4j中工作？
按钮大小改变时java字体大小改变
JavaSpock：类强制转换异常，但可用于实际调用
未能编译生成的JSP java文件
java如何从命令行运行osgi模块？

使用lxm在python中提取段落

输出

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用lxm在python中提取段落

输出

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >