<p>我目前正在使用BeautifulSoup来抓取一些网站,但是我对一些特定的字符有问题,UnicodedAmm里面的代码似乎表明这(再次)是微软发明的。在</p>
<p>我使用的是beauthulsoup(3.0.8.1)的最新版本,因为我仍然使用python2.5</p>
<p>以下代码说明了我的问题:</p>
<pre><code>from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup('...Baby One More Time (Digital Deluxe Version&hellip;')
print soup
'...Baby One More Time (Digital Deluxe Version&hellip;'
</code></pre>
<p>正如您所看到的,问题是末尾的“…”(&hellip)字符(您的浏览器可能正确地转义了该字符)。很明显,我不感兴趣。在</p>
<p>如果有这个字符unicode表示或其他什么的话,那就太好了。
即使完全无视它也能解决我的特殊问题。在</p>
<p>我怎么能用BeautifulSoup做到这一点?在</p>