Java中的lxml替代方案?

2024-10-04 05:32:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在广泛使用lxml开发算法。但是现在,由于performance问题,我不得不迁移到Java。寓意是,我能在Java中找到像lxmldom解析器一样棒的东西吗?在

>;关键要求:

1) feature like text_content() 2) iterchildren and 3) iterparent() and itersiblings()--- (if xpath is there, I think we can do such traversing, not sure).

Jsoup在那里很有名,但不确定是否能做到。我只想移植算法而不是大量重写。请提出建议。在

谢谢。在

为什么选择Java: 我在做复杂的nlp和dom解析任务。Python是首选,而且会留下来。写作c扩展是一回事,执行复杂的nlp任务是另一回事,合并两者又是另一回事。因此Java。没什么冒犯的。在


Tags: andtextgt算法解析器nlpperformancejava
1条回答
网友
1楼 · 发布于 2024-10-04 05:32:01

我认为撒克逊是你最好的选择。在下载的saxon-resources9-4.zip中可以找到大量示例:http://sourceforge.net/projects/saxon/files/Saxon-HE/9.4/类似xpath表达式:

    XPathExpression findLine =
        xpe.compile("//LINE[contains(., $word)]");
    XPathExpression findLocation =
        xpe.compile("concat(ancestor::ACT/TITLE, ' ', ancestor::SCENE/TITLE)");
    XPathExpression findSpeaker =
        xpe.compile("string(ancestor::SPEECH/SPEAKER[1])");

相关问题 更多 >