正则表达式:获取带空格的重音字母

2024-10-01 07:23:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从一个JSON字符串中提取一个关键字,并获取这个词的上下文。我的字符串看起来像:

JSON

{"1" : "Na casa de meu Pai há muitos aposentos; se não fosse assim, eu lhes teria dito. Vou preparar-lhes lugar."}

目前,我的Python代码是:

Python

re.findall(regex, string)

我想提供一个单词(例如,Pai)并获取关键字前后的单词。我的脚本将计算关键字的所有出现次数,并列出上下文单词。你知道吗

我的问题是:如何得到带空格、逗号、点等重音的字母?最好的方法是什么:列出所需的字符或排除不需要的字符?比如:

([^\"]+)Pai([^\"$]+)

Tags: 字符串jsonde关键字字符单词nase
1条回答
网友
1楼 · 发布于 2024-10-01 07:23:45

通过json.load()json.loads()加载JSON数据,然后使用^{}来帮助您探索文本中特定单词周围的单词,例如:

import nltk

text = 'Na casa de meu Pai há muitos aposentos; se não fosse assim, eu lhes teria dito. Vou preparar-lhes lugar.'
tokens = nltk.word_tokenize(text)

c = nltk.ConcordanceIndex(tokens, key=lambda s: s.lower())
result = []
for offset in c.offsets('Pai'):
    result += tokens[offset - 2: offset]
    result += tokens[offset + 1: offset + 3]

print(result)

打印['de', 'meu', 'há', 'muitos']。你知道吗

相关问题 更多 >