如何在Pylucene 8.6.1中创建自定义分析器？

import lucene from org.apache.lucene.analysis.core import WhitespaceAnalyzer from org.apache.lucene.index import IndexWriterConfig, IndexWriter from org.apache.lucene.store import SimpleFSDirectory from java.nio.file import Paths from org.apache.lucene.document import Document, Field, TextField index_path = "./index" lucene.initVM() analyzer = WhitespaceAnalyzer() config = IndexWriterConfig(analyzer) store = SimpleFSDirectory(Paths.get(index_path)) writer = IndexWriter(store, config) doc = Document() doc.add(Field("title", "The quick brown fox.", TextField.TYPE_STORED)) writer.addDocument(doc) writer.close() store.close()

from org.apache.lucene.analysis.core import LowerCaseFilter, WhitespaceTokenizer from org.apache.pylucene.analysis import PythonAnalyzer class MyAnalyzer(PythonAnalyzer): def __init__(self): PythonAnalyzer.__init__(self) def createComponents(self, fieldName): # What do I write here?

1条回答

网友

1楼 · 发布于 2024-09-30 04:37:53

我发现here和here下面的方法有效

from org.apache.lucene.analysis.core import LowerCaseFilter, WhitespaceTokenizer
from org.apache.pylucene.analysis import PythonAnalyzer
from org.apache.lucene.analysis import Analyzer

class MyAnalyzer(PythonAnalyzer):
    def __init__(self):
        PythonAnalyzer.__init__(self)

    def createComponents(self, fieldName):
        source = WhitespaceTokenizer()
        result = LowerCaseFilter(source)
        return Analyzer.TokenStreamComponents(source, result)

如果有人能给我指出正确的方向，让我能够正确地找到这些答案，那就太好了

相关问题更多 >

编程相关推荐

热门问题

热门文章