下面的重新编码是什么意思？

import re caps="([A-Z])" pre="(Mr|mr|Mr|St|st|ST|Mrs|MRS|mrs|Ms|MS|ms|Dr|DR|dr|miss|Miss|MISS)[\.\.\.]" def tokenize_sentence(text): text=re.sub(" ?"+pre,"\\1<dot>",text) text = re.sub(caps + "[.]" + caps + "[.]" + caps + "[.]", "\\1<prd>\\2<prd>\\3<prd>", text) print(text) tokenize_sentence("Mr. Ansh sahajpal A.B.C.")

1条回答

网友

1楼 · 发布于 2024-09-29 23:22:47

\1、\2等引用正则表达式中匹配的子表达式（括在括号中）。\1是第一个匹配的表达式，\2是第二个表达式，以此类推。它们在替换字符串中用于标记匹配的子表达式要修改的位置。在

匹配子表达式的常见约定是使用括号。下面是一个例子：

str = 'an example word:cat!!'
print (re.sub (r'word:(\w+)', r'\0dog', str))

它表示匹配冒号后面的任意数量的字母数字字符，并生成：

^{pr2}$

在本例中，（\w+）是一组字母数字字符的分组表达式，包括“\u”。在

编程相关推荐

使用SeleniumWebDriver（又称Selenium2.0）JAVA向下滚动鼠标
java获取与消费者组kafka关联的主题列表
java在现实生活中，您什么时候会使用堆栈而不是常规链表，或者使用常规队列而不是优先级队列？
java实际参数列表和形式参数列表的长度不同（但两种长度都是2？）
默认情况下，Lucene（java框架）是否根据术语计算文档的tfidf和余弦相似性？
java编辑XML样式表更改Android中的按钮
java在Eclipse4中从处理程序更新视图
java是节点列表、数组、列表还是其他什么？
java Hibernate查询问题
java Spark在并行化列表时引发ArrayIndexOutOfBoundsException

相关问题更多 >

编程相关推荐

热门问题

热门文章