Python中文
首页
教程
问答
标签
搜索
登录
注册
python中的复杂解析
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我对python有一个奇怪的解析问题。我需要分析以下文本。在</p> <p>这里我只需要(不包括)“pre”标签和数字列之间的部分(从2054164开始)。我有好几页是这种格式的。在</p> <pre><code><html> <pre> A Short Study of Notation Efficiency CACM August, 1960 Smith Jr., H. J. CA600802 JB March 20, 1978 9:02 PM 205 4 164 210 4 164 214 4 164 642 4 164 1 5 164 </pre> </html> </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我可能会用lxml或beauthoulsoup。在IMO中,regex被过度使用,尤其是在解析HTML时。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
(编辑)背景2+均值漂移跟踪?
1 回答
(网络爬虫)如何从新闻网站获取新闻段落的文本
6 回答
(置换)列表的唯一组合
4 回答
(美丽的soap4,)AttributeError:“非类型”对象没有属性“获取文本”
6 回答
(聊天室)使用套接字通常只允许一个地址(协议/网络地址/端口)
3 回答
(自动)在Pycharm/Python中的=后缩进
2 回答
(自动Py到Exe和Python)找不到“googleapipythonclient”发行版,该发行版是应用程序所必需的
8 回答
(自动操作)write()和do for循环的Odoo问题
1 回答
(自定义)百分位MSE损失函数
9 回答
(自定义用户)createsuperuser TypeError:hasattr():属性名必须是字符串
1 回答
(节点)警告:检测到可能的EventEmitter内存泄漏。添加了11个消息侦听器。使用emitter.setMaxListeners()增加limi
4 回答
(若变量中有字符串)语句未筛选出数据
3 回答
(英语、Perl、Python、Ruby)在代码片段的基础上进行比较?
10 回答
(范围(1,36),7)和+条件下的所有组合
2 回答
(范围(3),范围(3))值错误:要解压缩的值太多(预期为2)
3 回答
(蟒蛇) 平均分配数字
7 回答
(行、列):数据帧的值
10 回答
(行、列)形式的最小值
6 回答
(解决)导入PYBID11/C++编译模块不工作
3 回答
(记忆有效)将“排序”作为生成器实现
7 回答