我对python和代码还不熟悉。我有下面这样的大数据,并希望保存在csv文件与字段作为标题。所有字段以“,”分隔,每个参数的右侧都有值
例如,对于LAIGCINAME="LocalLA"
,LAIGCINAME
是字段,"LocalLA"
是值。我的问题是所有行都缺少一些字段。有没有人能帮我在python中处理这个问题,因为数据不同步
ZXWN:GCI="12345",LAIGCINAME="LocalLA",PROXYLAI=NO,MSCN="11223344",VLRN="11223344",MSAREANAME="0"
ZWGA:GCI="13DADC12",PROXYLAI=NO,MSCVLRTYPE=MSCVLRNUM,MSCN="33223344",VLRN="22334455",MSAREANAME="0",NONBCLAI=NO;
由于您的数据有许多可能的列名,因此需要首先解析整个文件以确定合适的列名列表。完成此操作后,可以写入输出文件的头,后跟所有数据
通过使用
csv.DictWriter()
对象,丢失的条目将作为空单元格写入。如果缺少值需要另一个值,例如“N/A”,则可以添加restval
参数对于给定的两行,这将为您提供如下输出文件:
csv.dictwriter
通过从字典中写一行来工作,csv.writer
通过获取项目列表来工作代码为每一行创建一个名为
output_row
的字典,然后将其写入输出文件。通过一次处理一行,脚本将能够处理任何大小的文件,而不会出现内存问题另一种方法是将整个文件读入内存,并创建一个字典列表,每行一个。可以同时计算
header
值。这一系列的词典可以一次完成例如:
注意,如果文件太大(您的问题提到您有大数据),这种方法将失败
相关问题 更多 >
编程相关推荐