我是Python开发新手,我必须实施一个关于数据分析的项目。我有一个data.txt文件,它具有以下值:
ID,name,date,confirmedInfections
DE2,BAYERN,2020-02-24,19
.
.
DE2,BAYERN,2020-02-25,19
DE1,BADEN-WÃœRTTEMBERG,2020-02-24,1
.
.
DE1,BADEN-WÃœRTTEMBERG,2020-02-26,7
.
.(lot of other names and data)
我想做什么?
正如你在上面的文件中所看到的,每个名字代表一个有新冠病毒感染的城市。对于每个城市,我需要为每个城市保存一个数据框,并绘制一个时间序列图,该图使用x轴上的日期索引和y轴上的确认影响。例如:
由于大数据文件有四列,我认为我在解析该文件和选择正确的值时犯了一个错误。下面是我的代码示例:
# Getting the data fron Bayern city
data = pd.read_csv("data.txt", index_col="name")
first = data.loc["BAYERN"]
print(first)
# Plotting the timeseries
series = read_csv('data.txt' ,header=0, index_col=0, parse_dates=True, squeeze=True)
series.plot()
pyplot.show()
下面是结果的照片:
正如您在x轴上看到的,我得到了data.txt中包含的所有不同ID。从中排除每个城市的ID和统计数据
谢谢你抽出时间
从CSV读取数据后,需要解析日期
我还没有测试这个特定的代码。 我希望这对你有用
相关问题 更多 >
编程相关推荐