Pandas数据帧。使用encoding='utf8'保存时丢失部分文本数据

2024-09-29 19:10:57 发布

男 | 程序猿一只，喜欢编程写python代码。

我试图将一个大的单词列表（俄语，unicoded）放到dataframe列中，并将结果dataframe保存到一个.csv文件中。我需要保存编码的文本，但是每当我手动设置encoding='utf-8'时，它会剪切我的一部分数据，并且只保存前100个字或其他内容。你知道吗

我使用的是python2.7。你知道吗

（列表非常大，所以这里我只写第一个和最后一个元素）

a = [u'\u0441\u043e\u0432\u043c\u0435\u0449\u0430\u0442\u044c', ... , u'\u044d\u043d\u0435\u0440\u0433\u0438\u0438']
s = [u'\u0441\u043e\u0432\u043c\u0435\u0449\u0430\u0442\u044c', ... , u'\u043b\u0438\u0447\u043d\u043e\u0439']


d = {'col1': [0, 1], 'col2': [a, s]}
df = pd.DataFrame(data=d)

df.to_csv('test.csv', encoding='utf-8')

听取任何建议。你知道吗

Tags： csv dataframe 列表 utf encoding u0430 u0438 u0442

1条回答

网友

1楼 · 发布于 2024-09-29 19:10:57

使用“拉丁语-1”而不是“utf-8”

Pandas数据帧。使用encoding='utf8'保存时丢失部分文本数据

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas数据帧。使用encoding='utf8'保存时丢失部分文本数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >