Python中文
首页
教程
问答
标签
搜索
登录
注册
使用grep在特定上下文中查找字符串
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我想从一个大文件中找到并提取被特定上下文包围的所有单词。文件中的所有行看起来都是这样的,但是在<code>></code>和<code><\w></code>之间有不同的单词:</p> <pre><code><="UO" lemma="|" lex="|" sense="|" prefix="|" suffix="|" compwf="|" complemgram="|" ref="05" dephead="04" deprel="ET">and<\w> </code></pre> <p>我只希望输出是'和'。所以我基本上想提取上下文<code>>xxx<\w></code>中的所有字符串(单词、标点和数字)。我用grep和regex尝试了很多不同的选择,但是我要么得到所有的单词,要么得到<code>></code>和<code><\w></code>的模式。。。从整个文件中,我希望输出如下所示:</p> <pre><code>and we appreciate this very much . </code></pre> <p>等等。。。你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你可以用这样的图案。这将匹配<code>></code>和<code><\w></code>之间的任何内容。你知道吗</p> <pre><code>import re pat = re.compile(r'>(.*?)<\\w>') pat.findall(input_string) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
5 回答
如何添加表示整数的擦边字符串?
3 回答
如何添加要在Bokeh中使用的新font.ttf文件?
3 回答
如何添加要显示的矩阵XY轴编号和XY轴
5 回答
如何添加计数?
9 回答
如何添加计数器函数?
3 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
4 回答
如何添加计数器来跟踪while循环中的月份和年份?
5 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
9 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
2 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
3 回答
如何添加评论拉梅尔亚姆
2 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
3 回答
如何添加谷歌地点自动完成到Flask?
10 回答
如何添加超时、python discord bot
10 回答
如何添加超过1dp的检查
5 回答
如何添加距离方法
10 回答
如何添加跟随游戏的敌人精灵
9 回答
如何添加路径以便python可以找到程序?
4 回答
如何添加身份验证/安全性以使用happybase访问HBase?
9 回答