我正在使用新冠病毒-19数据集,并使用了以下pivot函数:
url = 'https://opendata.ecdc.europa.eu/covid19/casedistribution/csv'
data = pd.read_csv(url,parse_dates=['dateRep'],index_col=['dateRep'])
data.head()
data.index.name = "date"
data = data.drop(['day', 'month', 'year','geoId','countryterritoryCode','continentExp'], axis = 1)
data = data.rename(columns={'countriesAndTerritories': 'country', 'popData2019':'population', 'continentExp' : 'continent' })
df_pivot = data.pivot(index = 'date', columns = 'country', values = 'cases').fillna(0)
df_pivot`
当我查看2020-01-04的美国案例时,数据透视框中的数字是“24998.0”,这是不正确的(应该是0)。谢谢你的建议
pivot
无法聚合,它只会重塑问题在于
pandas
自动解析索引,并将其与月份和日期混淆(因此将4月1日解析为1月4日)。最简单的方法是在读取数据后用一种格式手动解析数据现在我们可以看到一切都会好起来:
我们可以检查您的方法的解析是否变得混乱。自动解析将4月1日和1月4日混在一起
相关问题 更多 >
编程相关推荐