我一直在广泛使用lxml开发算法。但是现在,由于performance问题,我不得不迁移到Java。寓意是,我能在Java中找到像lxmldom解析器一样棒的东西吗?在
>;关键要求:
1) feature like text_content() 2) iterchildren and 3) iterparent() and itersiblings()--- (if xpath is there, I think we can do such traversing, not sure).
Jsoup在那里很有名,但不确定是否能做到。我只想移植算法而不是大量重写。请提出建议。在
谢谢。在
为什么选择Java: 我在做复杂的nlp和dom解析任务。Python是首选,而且会留下来。写作c扩展是一回事,执行复杂的nlp任务是另一回事,合并两者又是另一回事。因此Java。没什么冒犯的。在
我认为撒克逊是你最好的选择。在下载的saxon-resources9-4.zip中可以找到大量示例:http://sourceforge.net/projects/saxon/files/Saxon-HE/9.4/类似xpath表达式:
相关问题 更多 >
编程相关推荐