Python的csv、xml和特殊字符问题

with open(inputfile, 'rb') as csvfile: dialect = csv.Sniffer().sniff(csvfile.read(1024)) csvfile.seek(0) reader = csv.reader(csvfile, dialect) idflag=False try: for row in reader: if idflag: #print row[0] toEBU(row,id_row) #idflag=False #for testing, limits iterations if row[0].lower()=='id': idflag=True id_row=row

Traceback (most recent call last): File "extractor.py", line 121, in <module> main(sys.argv[1:]) File "extractor.py", line 106, in main toEBU(row,id_row) File "extractor.py", line 26, in toEBU file_name=unicode(row[4],"utf-8") UnicodeDecodeError: 'utf8' codec can't decode byte 0xe5 in position 9: invalid c ontinuation byte

18.6.,,Leveranse,Ferdig redigert 30 min AV presentason,Visning,Formidling,Digital historie,Ingen planer,,, ,,Kontaktperson,Tittel,E-post,Telefon,,,,, ,,XXXX XXXXX XXXXX,XXXXXXXXXXX,XXXX@XXXXXX.XXXX.XXXX,XXXXXXXX,,,,, ,,,,,,,,,, Id,Arkiv,Kilde,Modalitet,"Parametre, Filnavn","Beskrivelse, fri tekst",Script,Dreiebok,Opptaksplan,Nøkkelord,Rettigheter D5.1,Nei,E,Tekst,,Manus til videoforelesning (inneholder deler og bilder som beskrives under),Historisk oversikt over fyr og fyrliv i Frøya og Hitra,,Etter avtale med MMS,"Fyr, fyrstasjon", D5.2,Ja,E,Video,25 minutter??,Film fyrvokter,Inspeksjonstur på Slettringen,,Opptak gjort av «Frøya Film og bilde» v Petter Vågsvær 2011,Fyrvokter slettringen,?? D5.3,Ja,E,Tekst,Fyr i krig,Digital fortelling,"Krigshistorie på fyr, med fokus på fyr i Trlag",,,"Krig, luftangrep, terningen",

1条回答

网友

1楼 · 发布于 2024-10-01 09:21:43

简而言之，您的文件可能编码在“iso8859-1”中。（I）可以创建较小版本的文件：

from codecs import EncodedFile
with EncodedFile(open('n.txt','wb'),'utf-8','iso8859-1') as f:
 f.write('Bryllup på Terningen')

EncodedFile的参数表示原始文件（在python中）是“utf-8”，文件是用“iso8859-1”编码的。现在，如果我使用'iso8859-1'读取文件，我可以，但是'utf-8'将给出错误：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章