使用通用换行符将Django上载文件处理为UTF-8

import csv import codecs class CSVParser: def __init__(self,file): # 'file' is assumed to be an InMemoryUploadedFile object. dialect = csv.Sniffer().sniff(codecs.EncodedFile(file,"utf-8").read(1024)) file.open() # seek to 0 self.reader = csv.reader(codecs.EncodedFile(file,"utf-8"), dialect=dialect) try: self.field_names = self.reader.next() except StopIteration: # The file was empty - this is not allowed. raise ValueError('Unrecognized format (empty file)') if len(self.field_names) <= 1: # This probably isn't a CSV file at all. # Note that the csv module will (incorrectly) parse ALL files, even # binary data. This will catch most such files. raise ValueError('Unrecognized format (too few columns)') # Additional methods snipped, unrelated to issue

3条回答

网友

1楼 · 编辑于 2024-10-06 11:19:05

对于CSV和Excel上传到django，this site可能会有帮助。

网友

2楼 · 编辑于 2024-10-06 11:19:05

如上所述，我提供的代码片段实际上是按预期工作的——问题出在我的终端上，而不是python编码上。

如果您的视图需要访问UTF-8UploadedFile，您可以使用utf8_file = codecs.EncodedFile(request.FILES['file_field'],"utf-8")以正确的编码打开文件对象。

我还注意到，至少对于InMemoryUploadedFiles，通过codecs.EncodedFile包装器打开文件不会重置文件描述符的seek()位置。要返回到文件的开头（同样，这可能是特定于InMemoryUploadedFile），我只使用request.FILES['file_field'].open()将seek()位置发送回0。

网友

3楼 · 编辑于 2024-10-06 11:19:05

我使用csv.DictReader，它看起来运行良好。我附上了我的代码片段，但它基本上与这里的另一个答案相同。

import csv as csv_mod
import codecs

file = request.FILES['file']    
dialect = csv_mod.Sniffer().sniff(codecs.EncodedFile(file,"utf-8").read(1024))
file.open() 
csv = csv_mod.DictReader( codecs.EncodedFile(file,"utf-8"), dialect=dialect )

相关问题更多 >

编程相关推荐

热门问题

热门文章