提取包含法语单词“mais”的句子时，返回不包含该单词的句子

sentences_list_num = ['je ne suis pas mauvais mais lourd','je ne suis pas gentil', 'ce n\'est pas plus laid', 'ce ne sera jamais bordelique'] # Importing sentences which contains "mais" ; result :7477 sentences #word = 'mais' for sent in sentences_list_num: if 'mais' in sent: sentences_with_word_mais.append(sent) else : sentences_no_mais.append(sent) print(sentences_with_word_mais)

1条回答

网友

1楼 · 发布于 2024-09-27 21:27:51

字符串匹配不考虑单词边界。因此，根据Python，“mais”在“mais”和“jamais”中。您需要以某种方式指定“mais”必须是它自己的词。您可以使用正则表达式：

for sent in sentences_list_num:
  if len(re.findall(r'\Wmais\W', sent)) > 0:
    sentences_with_word_mais.append(sent)
  else:
    sentences_no_mais.append(sent)

如果您已经在使用spacy进行标记化，您也可以在每个句子中迭代标记并查找“MAI”

编程相关推荐

JavaSpringBootHibernate5忽略@Table和@Column
java readLine是如何工作的？
java除了Oracle的JVM（windows）之外，还有什么BSD许可的替代方案吗？
javascript处理程序执行导致异常：所需的MultipartFile参数“file”不存在
java如何检查url是否与标识符匹配？
java在对象创建之后实现一个接口
java安卓：如何将github库放入项目中
java如何制作自定义文本组件？
如何在java中更新属性文件
java Hibernate持久映射

相关问题更多 >

编程相关推荐

热门问题

热门文章