用Python中德语变音词查询mongoDB

2024-09-27 21:23:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我在mongoDB中有一个集合,其中包含一个字段“topic”的文档。在这些主题字段中有德语单词(大写),如“LANDSTRAßE”或“DçBLIN”。 我还有一个文本文件,每行都包含相同的主题(但小写)。 我想从我的文本文件中读取主题并基于它们查询我的收藏。 但是我的查询找不到具有该主题的文档,即使该主题确实存在于集合中。

以下是我如何阅读我的文本文件:

THIS_FOLDER = os.path.dirname(os.path.abspath(__file__))
topicsFileName = 'topics.txt'
with io.open(os.path.join(THIS_FOLDER, 'Assets', topicsFileName), encoding='utf8', errors='replace') as st:
  topics = st.readlines()

以下是我如何查询集合(例如,对于主题中的第一个主题):

^{pr2}$

知道吗,我怎样才能正确地进行查询?(对于没有元音变化的主题,例如“MARIAHILF”,该代码可以很好地工作)


Tags: path文档主题topicosmongodbfolderthis
1条回答
网友
1楼 · 发布于 2024-09-27 21:23:08

我发现问题出在哪里了。在MongoDB中,主题没有用正确的编码系统保存。因此,他们没有正确的德语字符。原因是,用于输入MongoDB集合中主题的文件不是用UTF-8编码的。所以我更新了MongoDB中的主题,现在查询工作得很好。在

相关问题 更多 >

    热门问题