Python中文
首页
教程
问答
标签
搜索
登录
注册
如何从文本中删除小写句子片段?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在尝试使用常规表达式或简单的Perl oneliner从标准文本文件中删除小写句子片段。在</p> <p>这些通常被称为言语或归因标签,例如-他说,她说,等等</p> <p>此示例显示使用手动删除之前和之后:</p> <ol> <li>原件:</li> </ol> <p>“啊,那是真的!”阿尤莎喊道。在</p> <p>“哦,别再装傻了!有个白痴进来,你让我们 真丢人!”窗边的女孩喊道,突然转向她父亲 带着轻蔑和轻蔑的神情。在</p> <p>“等等,瓦瓦拉!”她父亲喊道,专横地说 非常赞许地看着他们。”这就是她的性格,”他说, 再次向阿尤莎致辞。在</p> <p>“你去哪儿了?”他问他。在</p> <p>“我想,”他说,“我忘了一些事。。。我的手帕,我 想想。。。。好吧,即使我没有忘记什么,让我留下来 一点点。”</p> <p>他坐了下来。父亲站在他身边。在</p> <p>“你也坐下吧,”他说。在</p> <hr/> <ol start=“2”> <li>手动删除所有小写句子片段:</li> </ol> <p>“啊,那是真的!”在</p> <p>“哦,别再装傻了!有个白痴进来,你让我们 真丢人!”在</p> <p>“等等,瓦瓦拉!”这就是她的性格。”</p> <p>“你去哪儿了?”在</p> <p>“我想,”“我忘了一些事。。。我的手帕,我 想想。。。。好吧,即使我没有忘记什么,让我留下来 一点点。”</p> <p>他坐了下来。父亲站在他身边。在</p> <p>“你也坐下吧”</p> <hr/> <p>我把直引号改成了平衡和尝试:(…)+[.]</p> <p>当然,这会删除一些片段,但会删除一些平衡引号中的文本和以大写字母开头的文本。[^A-Z]在上面的表达式中无效。在</p> <p>我意识到要达到100%的准确率可能是不可能的,但是任何有用的表达式、perl或python脚本都将受到深切的感谢。在</p> <p>干杯</p> <p>亚伦</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>下面是一个Python代码片段:</p> <pre><code> thetext="""triple quoted paste of your sample text""" y=thetext.split('\n') for line in y: m=re.findall('(".*?")',line) if m: print ' '.join(m) else: print line </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
尽管Python中的所有内容都是引用,为什么Python导师在没有指针的列表中绘制字符串和整数?
8 回答
尽管python中的表达式为false,但循环仍在运行
9 回答
尽管python代码正确,但从nifi ExecuteScript处理器获取语法错误
5 回答
尽管Python在Neovim中工作得很好,但插件不能识别Neovim中的Python主机
10 回答
尽管python字典包含了大量的条目,但它并没有增长
7 回答
尽管python说模块存在,为什么我会得到这个消息?
4 回答
尽管setuptools和控制盘是最新的,但无法识别singleversionexternallymanaged
8 回答
尽管stdout和stderr重定向,但未捕获错误消息
8 回答
尽管Tensorboard的事件太大,但Tensorboard的步骤太少了
4 回答
尽管tkinter上的变量已更改,但显示未更改
7 回答
尽管try/except使用Python进行单元测试时出现断言错误
6 回答
尽管URL是sam,但仍会抛出“达到最大重定向”
3 回答
尽管url有效,Pandas仍读取url的\u csv错误
3 回答
尽管while中存在时间延迟,但LINUX线程的CPU利用率为100%(1)
4 回答
尽管x0在范围内,Scipy优化仍会引发ValueError
7 回答
尽管xpath正确,但使用selenium单击链接仍不起作用
1 回答
尽管下载了ffmpeg并设置了路径变量python,但没有后端错误
4 回答
尽管下载了i,但找不到型号“fr”
6 回答
尽管下载了plotnine包,但未获取名为“plotnine”的模块时出错
4 回答
尽管为所有行指定了权重,网格(0)仍不起作用
5 回答