在大型字符串文件中查找部分字符串匹配的最有效方法（python）

网友

1楼 · 编辑于 2024-06-03 00:24:06

格雷格的回答是好的，如果你想匹配个别单词。如果你想在子串上匹配，你需要一些更复杂的东西，比如后缀树(http://en.wikipedia.org/wiki/Suffix_-tree). 一旦构造完成，后缀树就可以有效地回答对任意子字符串的查询，因此在您的示例中，当有人搜索“hock”时，它可以匹配“Ice_nuhockey”。在

网友

2楼 · 编辑于 2024-06-03 00:24:06

如果您有一个固定的数据集和变量查询，那么通常的技术是将数据集重新组织为更容易搜索的内容。在抽象级别，您可以将每个文章标题分解为单独的小写单词，并将每个单词添加到Python字典数据结构中。然后，每当你得到一个查询，把查询词转换成小写，然后在字典中查找。如果每个字典条目值都是一个标题列表，那么您可以很容易地找到与给定查询词匹配的所有标题。在

这适用于直接的单词，但是您必须考虑是否要对相似的单词进行匹配，例如在查询为“smoke”时查找“smoking”。在

网友

3楼 · 编辑于 2024-06-03 00:24:06

我建议您将数据放入sqlite数据库中，并使用SQL“like”运算符进行搜索。在

相关问题更多 >

编程相关推荐

热门问题

热门文章