Python中文
首页
教程
问答
标签
搜索
登录
注册
Regex如何使用“or”进行字符串匹配
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我想在Python上使用regex解析web页面并找到特定的模式。在</p> <p>我的示例页面有:</p> <pre><code><input type="checkbox" name="some name...."> <input type="text", name="somemore name..."> <input type="radio" name="other name..."> </code></pre> <p>我想找到所有的matcihng<strong>名称</strong>值,这些值是收音机和复选框输入的。在</p> ^{pr2}$ <p>但我不知道如何将这些正则表达式组合成一个单独的?在</p> <p>编辑:这个问题可能会转到其他方向。但最好告诉我想做什么,我选择的regex用法是否真的适合这一点。。。在</p> <p>我必须查询<strong>订户</strong>,并获得有关<strong>订户</strong>的一些基本信息,以及该订户的可用<strong>贷款和收费</strong>列表。相关的模块有许多脚本可以使用regex完成这类工作。我在代码的某些部分也使用了SGMLparser。但我有时会看到SGML解析器无法解析HTML(不了解它失败的原因,但基本原因是<em>意外的char</em>类型错误)。所以,我必须确保我既可以处理所有类型的HTML代码,也可以继续使用regex。在</p> <p>结论:使用<code>HTMLParser</code>是最好的选择,而使用<code>regex</code>是一个非常糟糕的主意。。。这就是我从这个问题中得到的。。。但由于<strong>问题本身</strong>更多的是关于<em>regex matcihng</em>而不是<em>正则表达式在thml</em>中的使用,我决定<em>接受</em>关于正则表达式的答案。。。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你不应该用正则表达式处理HTML。。。这里有很多线索告诉你原因。也许您可以查看<a href="https://stackoverflow.com/questions/717541/parsing-html-in-python">this</a>上一个SO线程,其中讨论了Python的各种HTML解析器。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
6 回答
如何添加表示整数的擦边字符串?
7 回答
如何添加要在Bokeh中使用的新font.ttf文件?
3 回答
如何添加要显示的矩阵XY轴编号和XY轴
4 回答
如何添加计数?
3 回答
如何添加计数器函数?
2 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
3 回答
如何添加计数器来跟踪while循环中的月份和年份?
9 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
7 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
9 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
2 回答
如何添加评论拉梅尔亚姆
10 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
10 回答
如何添加谷歌地点自动完成到Flask?
1 回答
如何添加超时、python discord bot
9 回答
如何添加超过1dp的检查
4 回答
如何添加距离方法
6 回答
如何添加跟随游戏的敌人精灵
5 回答
如何添加路径以便python可以找到程序?
6 回答
如何添加身份验证/安全性以使用happybase访问HBase?
3 回答