检测单词中的重音（Python）

import re anadict = {}; for line in open('fakedic.txt'):#/usr/share/dict/words'): word = line.strip().lower().replace("'", "") line = ''.join(sorted(ch for ch in word if word if ch.isalnum($ if isinstance(word, unicode): print word print "UNICODE!" pattern = re.compile(r'xc3') if pattern.findall(word): print 'Found' print word if anadict.has_key(line): if not (word in anadict[line]): anadict[line].append(word) else: anadict[line] = [word] for key in anadict: if (len(anadict[key]) >= 1): print anadict[key]

2条回答

网友

1楼 · 编辑于 2024-10-01 13:38:57

所以基本上我的答案是。。。看看这里：

How to check if a string in Python is in ASCII?

要点是，您可以检查每个字符，看看字符的ord是否小于128，这允许您检查它是否是重音字符。或者你可以做很多尝试和捕捉，寻找unicode错误，这些错误将在重音字符期间抛出。（后者似乎是更有效的答案）

对我来说，这绝对是一次学习的经历：）很抱歉花了这么长时间

网友

2楼 · 编辑于 2024-10-01 13:38:57

最后，我使用正则表达式（基本上是为了检查所有非字母字符的内容）：

if re.match('^[a-zA-Z_]+$', word):

这帮我去掉了任何有\或其他数字或怪异符号的单词。不是一个完美的解决方案，但它奏效了。在

相关问题更多 >

编程相关推荐

热门问题

热门文章