The string is split into tokens wherever whitespace or special
characters (punctuation marks, hash sign, etc.) appear. The index will
include an entry for each token. This enables you to search for
keywords and phrases comprising only part of a field's value.
因此,你的假设是:
So I would assume a search for 'pyt' would now return 'python'
https://cloud.google.com/appengine/docs/python/search/中的“API支持字符串字段的部分文本匹配”是指通过标记匹配。具体来说,请参见https://cloud.google.com/appengine/docs/python/search/#Python_Tokenizing_string_fields…:
因此,你的假设是:
“部分搜索”是指文档的一部分(文本字段中标记的子集),不是每个标记的部分(这将导致组合爆炸,例如单个令牌{}必须作为每个条目编制索引:
如果你想要这样,你可以很容易地编写自己的代码来产生爆炸(从一个真正的开始文档中生成一个包含所有这些子字符串的伪文档),但是,对于任何一个不平凡的起始文档,你可能很容易就要为一笔荒唐的资源付出代价,或者达到绝对最高配额的硬上限。在
提示:如果你在网上搜索“pyt”,你会找到包含“python”的文档吗?试一试前者的点击率为1000万次(半岛青年剧院、迈克尔·杰克逊的P.Y.T.(《美丽的年轻人》等),后者的点击率为1.8亿次(语言、蛇、喜剧)组别:-). 在
相关问题 更多 >
编程相关推荐