我想把第3列中的所有值求和,得到一个新的csv文件,第一列和第二列使用pandas,这是一种更有效的思考。在
可以相加的最大值介于0和2之间
如果存在0.5、1或2以外的值或字符,则将忽略加法
csv文件示例:
encounterId|chartTime|11885|67187|6711|6711|6710|1356|1357|1358|1359|1360|1361|1362|1366|140|140
325|2014-01-01 00:00:00|0
325|2014-01-01 01:00:00|0|0|0
325|2014-01-01 02:00:00|0
325|2014-01-01 03:00:00|0|0|0
325|2014-01-01 04:00:00|0
325|2014-01-01 05:00:00|1
325|2014-01-01 06:00:00|0|0|0
325|2014-01-01 07:00:00|1|0|0.5|1
325|2014-01-01 08:00:00|0
325|2014-01-01 09:00:00|1|0|0
325|2014-01-01 10:00:00|0
325|2014-01-01 11:00:00|1|0|0
325|2014-01-01 12:00:00|0
325|2014-01-01 13:00:00|0|0|0.5|1
325|2014-01-01 14:00:00|0
325|2014-01-01 15:00:00|0
我要找的是:
^{pr2}$我试过没有熊猫,结果很奇怪
请注意,
pd.read_csv()
如果读取列数可变的csv,则会抛出错误,除非您事先提供列名。这应该做到:给出:
^{pr2}$这里有一个更简洁的方法(它非常类似于@Scott Boston下面的答案,但是避免了创建单独的数据帧)。将csv的前两列设置为dataframe的索引,可以有条件地过滤只包含float值的其余dataframe:
给出:
使用,这个:
输出:
^{pr2}$您只需求和并设置param axis=1,如前一个答案here
相关问题 更多 >
编程相关推荐