Pandas数据帧。使用encoding='utf8'保存时丢失部分文本数据

2024-09-29 19:10:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图将一个大的单词列表(俄语,unicoded)放到dataframe列中,并将结果dataframe保存到一个.csv文件中。我需要保存编码的文本,但是每当我手动设置encoding='utf-8'时,它会剪切我的一部分数据,并且只保存前100个字或其他内容。你知道吗

我使用的是python2.7。你知道吗

(列表非常大,所以这里我只写第一个和最后一个元素)

a = [u'\u0441\u043e\u0432\u043c\u0435\u0449\u0430\u0442\u044c', ... , u'\u044d\u043d\u0435\u0440\u0433\u0438\u0438']
s = [u'\u0441\u043e\u0432\u043c\u0435\u0449\u0430\u0442\u044c', ... , u'\u043b\u0438\u0447\u043d\u043e\u0439']


d = {'col1': [0, 1], 'col2': [a, s]}
df = pd.DataFrame(data=d)

df.to_csv('test.csv', encoding='utf-8')

听取任何建议。你知道吗


Tags: csvdataframe列表utfencodingu0430u0438u0442

热门问题