java文本迭代器和字符串
我想知道是否有办法将字符串转换为文本迭代器,然后删除任何所需的标记?假设字符串来自节点的文本内容,则希望查找特定的单词,然后删除它们
Set<String> Words = new LinkedHashSet<String>();
BufferedReader br = new BufferedReader(new FileReader("useless words.txt"));
for(String line;(line = br.readLine()) != null;)
stopWords.add(line.trim().toString());
br.close();
# 1 楼答案
Java的rexex工厂非常适合这种情况
你的正则表达式模式可能看起来像这样。。。“\w+”模式的最佳参考是here
在this tutorial的matcher部分有一个例子,展示了如何使用regex模式和matcher替换文本。一旦找到匹配项,就可以向审查员查询单词的哈希图