Python中文网

一个关于 编程问题的解答网站.

有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java文本迭代器和字符串

我想知道是否有办法将字符串转换为文本迭代器,然后删除任何所需的标记?假设字符串来自节点的文本内容,则希望查找特定的单词,然后删除它们

Set<String> Words = new LinkedHashSet<String>();
BufferedReader br = new BufferedReader(new FileReader("useless words.txt"));
for(String line;(line = br.readLine()) != null;)
   stopWords.add(line.trim().toString());

br.close();

共 (1) 个答案

  1. # 1 楼答案

    Java的rexex工厂非常适合这种情况

    你的正则表达式模式可能看起来像这样。。。“\w+”模式的最佳参考是here

    this tutorial的matcher部分有一个例子,展示了如何使用regex模式和matcher替换文本。一旦找到匹配项,就可以向审查员查询单词的哈希图