Python中文
首页
教程
问答
标签
搜索
登录
注册
UnicodeDecodeError:“ascii”编解码器无法解码字节NLTK
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>以下代码打印数据:</p> <pre><code>f = codecs.open('scrapeddata.csv', 'r') data = f.read() print data </code></pre> <p>数据如下:</p> ^{pr2}$ <p>然后,我尝试用以下代码进行简单的词频分析:</p> <pre><code>from nltk import FreqDist, sent_tokenize, word_tokenize data = word_tokenize(data) freq = FreqDist(data) freq </code></pre> <p>这将返回:</p> <pre><code>----> 3 data = word_tokenize(data) UnicodeDecodeError: 'ascii' codec can't decode byte 0x94 in position 14: ordinal not in range(128) </code></pre> <p>有什么帮助吗?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>原始数据通过网络抓取收集。所以我改变了在csv中保存原始数据的方式,并修复了ascii错误。在</p> <pre><code>data = [' scrapped data here'] w = csv.writer(open('scrapeddata.csv', 'wb')) for sentence in data: w.writerow([sentence.encode('ascii','ignore')]) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
1 回答
无法使用Django\u mssql\u后端迁移到外部hos
8 回答
无法使用Django&Python3.4连接到MySql
7 回答
无法使用Django+nginx上载媒体文件
7 回答
无法使用Django1.6导入名称模式
8 回答
无法使用Django1.7和mongodb登录管理站点
8 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
2 回答
无法使用Djangockedi验证CBV中的字段
5 回答
无法使用Djangocketditor上载图像(错误400)
8 回答
无法使用Djangocron进行函数调用
3 回答
无法使用Djangofiler djang上载文件
8 回答
无法使用Djangokronos
10 回答
无法使用Djangomssql provid
8 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
2 回答
无法使用Djangomssq迁移Django数据库
4 回答
无法使用Djangonox创建用户
4 回答
无法使用Djangopyodb从Django查询SQL Server
6 回答
无法使用Djangopython3ldap连接到ldap
5 回答
无法使用Djangoredis连接到redis
9 回答
无法使用Django中的FK创建新表
7 回答