擅长:python、mysql、java
我对Python的经验较少,所以我个人会用C或C++来做。
这个问题被简化了,因为您只寻找精确的匹配。你知道吗</p>
<p>内环是所有时间都花在的地方,所以我会集中精力。你知道吗</p>
<p>首先,我将获取5e4术语的列表,对它们进行排序,将它们放在表中进行二进制搜索,或者(更好的是)将它们放在trie结构中进行逐字搜索。你知道吗</p>
<p>然后,在“句子”中的每个字符位置,调用搜索函数。
应该很快。
原则上,哈希表具有O(1)性能,但常量因子很重要。
我敢打赌,在这种情况下,trie仍然比它强,你可以把它调出来。你知道吗</p>