有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java比正则表达式更好的系统

我已经做了一个应用程序,可以提取一些特定的信息从一个特定的网站。为此,我使用了正则表达式,它提供了所需的输出。对于这个简单的爬虫程序,有没有比regex更有效的过程或想法呢


共 (1) 个答案

  1. # 1 楼答案

    如果你说一个简单的正则表达式可以解决你的问题,那么没有其他更有效的解决方案了。 当涉及到爬行时,另一种选择是在内存中加载整个html页面,在DOM文档中,并使用XPath甚至XQuery进行搜索。但实际上,如果使用正则表达式可以轻松提取信息,那么就不用麻烦了,尤其是如果您不熟悉XPath的话

    当你想进行复杂的搜索时,XPath的强大功能就在眼前。对于这项任务来说,它比正则表达式更优雅(至少在w3c的oppinion中是这样)。但是如果你想要一个快速的解决方案,你已经找到了,而且它在RAM方面也更有效