忽略中的错误数据行Pandas.read_csv（）that break header=关键字问题的回答

忽略中的错误数据行Pandas.read_csv（）that break header=关键字

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有一系列凌乱的*.csv文件被熊猫读入。csv示例如下： <pre><code>Instrument 35392 "Log File Name : station" "Setup Date (MMDDYY) : 031114" "Setup Time (HHMMSS) : 073648" "Starting Date (MMDDYY) : 031114" "Starting Time (HHMMSS) : 090000" "Stopping Date (MMDDYY) : 031115" "Stopping Time (HHMMSS) : 235959" "Interval (HHMMSS) : 010000" "Sensor warmup (HHMMSS) : 000200" "Circltr warmup (HHMMSS) : 000200" "Date","Time","","Temp","","SpCond","","Sal","","IBatt","" "MMDDYY","HHMMSS","","øC","","mS/cm","","ppt","","Volts","" "Random message here 031114 073721 to 031114 083200" 03/11/14,09:00:00,"",15.85,"",1.408,"",.74,"",6.2,"" 03/11/14,10:00:00,"",15.99,"",1.96,"",1.05,"",6.3,"" 03/11/14,11:00:00,"",14.2,"",40.8,"",26.12,"",6.2,"" 03/11/14,12:00:01,"",14.2,"",41.7,"",26.77,"",6.2,"" 03/11/14,13:00:00,"",14.5,"",41.3,"",26.52,"",6.2,"" 03/11/14,14:00:00,"",14.96,"",41,"",26.29,"",6.2,"" "message 3" "message 4"** </code></pre> 我一直在使用此代码导入*csv文件，处理双标题，拉出空列，然后用错误数据剥离有问题的行： ^{pr2}$ 这一切都很顺利，直到我有一个文件，在标题后面有一行错误的1行：“Random message here 031114 073721 to 031114 083200” 我收到的错误是： <pre><code> *C:\Users\USER\AppData\Local\Continuum\Anaconda3\lib\site- packages\pandas\io\parsers.py in _do_date_conversions(self, names, data) 1554 data, names = _process_date_conversion( 1555 data, self._date_conv, self.parse_dates, self.index_col, -> 1556 self.index_names, names, keep_date_col=self.keep_date_col) 1557 1558 return names, data C:\Users\USER\AppData\Local\Continuum\Anaconda3\lib\site- packages\pandas\io\parsers.py in _process_date_conversion(data_dict, converter, parse_spec, index_col, index_names, columns, keep_date_col) 2975 if not keep_date_col: 2976 for c in list(date_cols): -> 2977 data_dict.pop(c) 2978 new_cols.remove(c) 2979 KeyError: ('Time', 'HHMMSS')* </code></pre> 如果我删除这行代码，代码就可以正常工作了。类似地，如果我删除头=行，代码就可以正常工作。但是，我希望能够保存这个，因为我正在阅读数百个这样的文件。在 困难：在调用熊猫.read_csv（）因为这些文件可能相当大，所以我不想多次读取和保存！另外，我更喜欢一个真正的pandas/pythonic解决方案，它不需要首先将文件作为stringIO缓冲区打开，而不是删除有问题的行。在

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

忽略中的错误数据行Pandas.read_csv（）that break header=关键字

1 个回答

相关Python问题