如何在python中处理unicode语言

2024-10-04 09:19:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在写一个Python+Selenium脚本来废弃Linkedin站点。
我使用以下语句阅读概要文件摘要,该语句正常工作:

profileDescription = profile.find_element_by_xpath("div/div[1]").text  

我的问题是来自网站的非英语数据。
我使用以下代码将从站点中删除的数据写入excel:

with open('search.csv', 'ab') as csvfile:
    self.liSearchOutWriter = csv.writer(csvfile, delimiter=',')
    self.liSearchOutWriter.writerow([profileDescription]) 

每当描述包含非英语数据时,它不会在excel中正确显示。我通读了unicodeutf8资源,但无法掌握它。你知道吗

有人能帮我理解如何修改代码以正确显示非英语数据吗?你知道吗


Tags: 文件csv数据csvfile代码selfdiv脚本
1条回答
网友
1楼 · 发布于 2024-10-04 09:19:17

在Python3.X中,这是现成的:

 import csv
 with open('search.csv', newline='', encoding='utf-8') as csvfile:
     reader = csv.reader(csvfile)
     for row in reader:
         print(row)

如果您使用的是Python2.X,则有一个支持unicode的csv插件库: unicode-csv

import unicodecsv
with open('search.csv', newline='', encoding='utf-8') as csvfile:
    unicodecsv.reader(f, encoding='utf-8'

相关问题 更多 >