Python中文
首页
教程
问答
标签
搜索
登录
注册
防止RegEx挂在大火柴上
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>这是一个很好的日期正则表达式。。。但是它无限期地挂在我尝试过的这一页上。。。我想试试这个页面(<a href="http://pleac.sourceforge.net/pleac_python/datesandtimes.html" rel="nofollow noreferrer">http://pleac.sourceforge.net/pleac_python/datesandtimes.html</a>),因为它确实有很多日期,我想把它们都抓到。我不明白为什么它挂在其他页面上。。。为什么我的regexp挂起和/或我如何清理它以使它更好/更有效率?在</p> <p>Python代码:</p> <pre><code>monthnames = "(?:Jan\w*|Feb\w*|Mar\w*|Apr\w*|May|Jun\w?|Jul\w?|Aug\w*|Sep\w*|Oct\w*|Nov(?:ember)?|Dec\w*)" pattern1 = re.compile(r"(\d{1,4}[\/\\\-]+\d{1,2}[\/\\\-]+\d{2,4})") pattern4 = re.compile(r"(?:[\d]*[\,\.\ \-]+)*%s(?:[\,\.\ \-]+[\d]+[stndrh]*)+[:\d]*[\ ]?(PM)?(AM)?([\ \-\+\d]{4,7}|[UTCESTGMT\ ]{2,4})*"%monthnames, re.I) patterns = [pattern4, pattern1] for pattern in patterns: print re.findall(pattern, s) </code></pre> <p>顺便说一句。。。当我说我在这个网站上尝试。。我试着用网页来源。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>正则表达式的编写方式将导致大量的回溯。除了在较小的文本块上运行它的技巧之外,您还可以使用一个更简单(因而更快)的regex来过滤不匹配的文本。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
4 回答
如何添加表示整数的擦边字符串?
7 回答
如何添加要在Bokeh中使用的新font.ttf文件?
7 回答
如何添加要显示的矩阵XY轴编号和XY轴
10 回答
如何添加计数?
5 回答
如何添加计数器函数?
3 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
5 回答
如何添加计数器来跟踪while循环中的月份和年份?
3 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
3 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
1 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
5 回答
如何添加评论拉梅尔亚姆
4 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
4 回答
如何添加谷歌地点自动完成到Flask?
10 回答
如何添加超时、python discord bot
6 回答
如何添加超过1dp的检查
7 回答
如何添加距离方法
2 回答
如何添加跟随游戏的敌人精灵
9 回答
如何添加路径以便python可以找到程序?
2 回答
如何添加身份验证/安全性以使用happybase访问HBase?
10 回答