解析csv文件并使用Python打印

2024-09-29 23:16:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我是Python开发新手,我必须实施一个关于数据分析的项目。我有一个data.txt文件,它具有以下值:

ID,name,date,confirmedInfections
DE2,BAYERN,2020-02-24,19
.
.
DE2,BAYERN,2020-02-25,19
DE1,BADEN-WÃœRTTEMBERG,2020-02-24,1
.
.
DE1,BADEN-WÃœRTTEMBERG,2020-02-26,7
.
.(lot of other names and data)

我想做什么?

正如你在上面的文件中所看到的,每个名字代表一个有新冠病毒感染的城市。对于每个城市,我需要为每个城市保存一个数据框,并绘制一个时间序列图,该图使用x轴上的日期索引和y轴上的确认影响。例如: enter image description here

由于大数据文件有四列,我认为我在解析该文件和选择正确的值时犯了一个错误。下面是我的代码示例:

# Getting the data fron Bayern city
data = pd.read_csv("data.txt", index_col="name")
first = data.loc["BAYERN"]
print(first)

# Plotting the timeseries
series = read_csv('data.txt' ,header=0, index_col=0, parse_dates=True, squeeze=True)
series.plot()
pyplot.show()

下面是结果的照片:

enter image description here

正如您在x轴上看到的,我得到了data.txt中包含的所有不同ID。从中排除每个城市的ID和统计数据

谢谢你抽出时间


Tags: 文件csvthenametxtidreaddata
1条回答
网友
1楼 · 发布于 2024-09-29 23:16:57

从CSV读取数据后,需要解析日期

import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt
# You can limit the columns as below provided
headers = ['ID','name','date','confirmedInfections']
data = pd.read_csv('data.csv',names=headers)

data['Date'] = data['Date'].map(lambda x: datetime.strptime(str(x), '%Y/%m/%d'))
x = data['Date']
y = data['confirmedInfections']

# Plot using pyplotlib
plt.plot(x,y)
# display chart
plt.show()

我还没有测试这个特定的代码。 我希望这对你有用

相关问题 更多 >

    热门问题