Python中文
首页
教程
问答
标签
搜索
登录
注册
UnicodeDecodeError:“ascii”编解码器无法解码字节NLTK
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>以下代码打印数据:</p> <pre><code>f = codecs.open('scrapeddata.csv', 'r') data = f.read() print data </code></pre> <p>数据如下:</p> ^{pr2}$ <p>然后,我尝试用以下代码进行简单的词频分析:</p> <pre><code>from nltk import FreqDist, sent_tokenize, word_tokenize data = word_tokenize(data) freq = FreqDist(data) freq </code></pre> <p>这将返回:</p> <pre><code>----> 3 data = word_tokenize(data) UnicodeDecodeError: 'ascii' codec can't decode byte 0x94 in position 14: ordinal not in range(128) </code></pre> <p>有什么帮助吗?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>打开文件时提供显式编码。你说是UTF-8,那么告诉Python:</p> <pre><code>f = codecs.open('scrapeddata.csv', 'r', 'utf-8') data = f.read() </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
8 回答
无法使用Django\u mssql\u后端迁移到外部hos
4 回答
无法使用Django&Python3.4连接到MySql
8 回答
无法使用Django+nginx上载媒体文件
1 回答
无法使用Django1.6导入名称模式
7 回答
无法使用Django1.7和mongodb登录管理站点
3 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
10 回答
无法使用Djangockedi验证CBV中的字段
5 回答
无法使用Djangocketditor上载图像(错误400)
6 回答
无法使用Djangocron进行函数调用
5 回答
无法使用Djangofiler djang上载文件
1 回答
无法使用Djangokronos
5 回答
无法使用Djangomssql provid
3 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
1 回答
无法使用Djangomssq迁移Django数据库
1 回答
无法使用Djangonox创建用户
10 回答
无法使用Djangopyodb从Django查询SQL Server
5 回答
无法使用Djangopython3ldap连接到ldap
2 回答
无法使用Djangoredis连接到redis
6 回答
无法使用Django中的FK创建新表
1 回答