如何通过匹配长度提高NGrams的排名

ngram_filter = token_filter( 'ngram_filter', type='ngram', min_gram=3, max_gram=10, ) ngram_analyzer = analyzer( 'ngram_analyzer', type='custom', tokenizer='whitespace', filter=[ 'lowercase', ngram_filter ] )

1条回答

网友

1楼 · 发布于 2024-09-28 19:29:53

在离开一段时间并思考之后，我决定将NGram分析器分成不同的字段，按长度分开。这样我可以手动增加更长的NGram匹配。我想我试图在一个领域做的太多了

我不是像这样使用django elasticsearch dsl以编程方式构建它们

ngram_analyzers = {
    f'{i}ngram': fields.TextField(
        analyzer=analyzer(
            f'{i}ngram_analyzer',
            type='custom',
            tokenizer='whitespace',
            filter=[
                'lowercase',
                token_filter(
                    f'{i}ngram_filter',
                    type='ngram',
                    min_gram=i,
                    max_gram=i
                )
            ]
        )
    ) for i in range(3, 11)
}

ngram_analyzers.update({
            'stemmed': fields.TextField(
                analyzer='english',
            )
        })

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何通过匹配长度提高NGrams的排名

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >