Python中文
首页
教程
问答
标签
搜索
登录
注册
Python正则表达式匹配单引号中的文本,忽略转义引号(和制表符/换行符)
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>给定一个文本文件,其中要匹配的字符由单引号分隔,但可能有零个或一个转义单引号,以及零个或多个制表符和换行符(未转义)-我只想匹配文本。示例:</p> <pre><code>menu_item = 'casserole'; menu_item = 'meat loaf'; menu_item = 'Tony\'s magic pizza'; menu_item = 'hamburger'; menu_item = 'Dave\'s famous pizza'; menu_item = 'Dave\'s lesser-known gyro'; </code></pre> <p>我只想抓取文本(和空格),忽略制表符/换行符-实际上我并不关心转义引号是否出现在结果中,只要它不影响匹配:</p> <pre><code>casserole meat loaf Tonys magic pizza hamburger Daves famous pizza Dave\'s lesser-known gyro # quote is okay if necessary. </code></pre> <p>我已经创建了一个regex,<em>几乎</em>会这样做-它处理转义引号,但不处理换行符:</p> <pre><code>menuPat = r"menu_item = \'(.*)(\\\')?(\t|\n)*(.*)\'" for line in inFP.readlines(): m = re.search(menuPat, line) if m is not None: print m.group() </code></pre> <p>这里肯定有很多正则表达式问题——但大多数都在使用Perl,如果有一个问题能满足我的要求,我就想不出来了:)而且由于我使用的是Python,我不在乎它是否分布在多个组中,所以很容易重新组合它们。</p> <p>有人说,一些答案只是与代码解析文本。虽然我确信我可以做到这一点-我非常接近拥有一个工作的regex:)而且似乎它应该是可行的。</p> <p>更新:我刚刚意识到我正在使用Python<em>readlines()</em>来获取每一行,这显然是在分解传递给regex的行。我正在考虑重新编写它,但任何关于这方面的建议也会非常有帮助。</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>这应该做到:</p> <pre><code>menu_item = '((?:[^'\\]|\\')*)' </code></pre> <p>这里的<code>(?:[^'\\]|\\')*</code>部分匹配任何字符序列,除了<code>'</code>和<code>\</code>或文本<code>\'</code>。前一个表达式<code>[^'\\]</code>也允许换行符和制表符,然后需要用单个空格替换它们。</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
10 回答
为什么在使用strptim时会出现这个datetime日期错误
1 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
10 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
2 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
6 回答
为什么在使用tabla时会得到一个空的数据帧?
5 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
3 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
4 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
2 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
8 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
2 回答
为什么在使用TextBlob时会出现HTTP错误?
6 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
7 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
7 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
6 回答
为什么在使用tkinter时不能使用复选框?
9 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
5 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
3 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
2 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
6 回答