有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java搜索文本中的字符串模式

我试图用Java编写一个程序,在文本文件中查找字符串模式。 考虑下面的文本,取自小说:

他想,她是一个非常棒的女人。然后她说:“你好,我叫劳伦,你叫什么?”

我想找到一种方法来查找这一系列单词的任何出现:HELLO,any string,NAME(取自列表),这样,从上面的示例中,我可以得到(粗体):

他想,她是一个非常棒的女人。然后她说:“你好,我叫劳伦。你叫什么?”

起初我考虑使用regex,然后考虑编写一个解析器(可能是JFlex或antl生成的解析器)

有人知道一个更简单、更快速的编码解决方案吗


共 (3) 个答案

  1. # 1 楼答案

    您可以尝试使用stanford POS tagger标记句子的部分,然后使用您正在寻找的标准获取这些句子

  2. # 2 楼答案

    试试Java搜索引擎Lucene。你需要一些能理解n-grams的东西

  3. # 3 楼答案

    我认为,如果您只是尝试匹配HELLO(不区分大小写)、任意字符串、Name(取自列表),那么使用Pattern类的正则表达式是最好的选择

    看一看在线正则表达式求值器来构建表达式(比如http://www.regular-expressions.info/javascriptexample.html)。构建表达式需要花费一些工作,但一旦完成,它将提供一种简洁的方式来表达字符串搜索模式