擅长:python、mysql、java
<p>使用大写<code>\W</code>=匹配<em>非</em>字母数字字符,<em>不包括</em><code>_</code>。在</p>
<pre><code>>>> re.findall('[\W]+', u"# @, ►(Q1)-grijesh b ►((Qf)), ");
[u'# @, \u25ba(', u')-', u' ', u' \u25ba((', u')), ']
</code></pre>
<p>From:<a href="https://docs.python.org/2/howto/unicode.html#unicode-howto" rel="nofollow">Unicode HOWTO?</a>要读取unicoded文本文件,请使用:</p>
^{pr2}$
<p>我有个档案:</p>
^{3}$
<p>从Python中读取:</p>
<pre><code>>>> import re
>>> import codecs
>>> f = codecs.open('file', encoding='utf-8')
>>> for l in f:
... print re.findall('[\W]+', l)
...
[u'# @, \u25ba(', u')-', u' ', u' \u25ba((', u')),\n']
>>>
</code></pre>
<p>读字母单词</p>
<pre><code>>>> f = codecs.open('file', encoding='utf-8')
>>> for l in f:
... print re.findall('[^\W]+', l)
...
[u'Q1', u'grijesh', u'b', u'Qf']
</code></pre>
<p>注意:小<code>\w</code>匹配字母数字字符,<em>包括</em><code>_</code>。在</p>