根据Matplotlib中的条件标记特定点

2024-05-20 05:28:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我绘制了df['Data']的最小点

Timestamp = pd.date_range('2020-02-06 08:23:04', periods=1000, freq='s')
df = pd.DataFrame({'Timestamp': Timestamp,
                   'Data': 30+15*np.cos(np.linspace(0,10,Timestamp.size))})

df['timediff'] = (df['Timestamp'].shift(-1) - df['Timestamp']).dt.total_seconds()   
df['datadiff'] = df['Data'].shift(-1) - df['Data']
df['gradient'] = df['datadiff'] / df['timediff']

min_pt = np.min(df['Data'])       
# filter_pt = df.loc(df['gradient'] >= -0.1) # & df.loc[i, 'gradient'] <=0.1

mask = np.array(df['Data']) == min_pt 
color = np.where(mask, 'blue', 'yellow')

fig,ax = plt.subplots(figsize=(20,10))
# plt.plot_date(df['Timestamp'], df['Data'], '-' )
ax.scatter(df['Timestamp'], df['Data'], color=color, s=10)
plt.ticklabel_format
plt.show()

情节如下所示: enter image description here

我想使用df['gradient']列扩展条件:

  1. 如果不是只标记“最小”点,而是要标记gradient位于0.1和-0.1之间(包括0.1和-0.1)的点,该怎么办
  2. 附加条件:仅获取该范围内的第一个数据点(即0.0.1和-0.1)
  3. 如何循环遍历整个数据集,而不是只获取满足这些条件的第一个数据点(我当前的绘图是这样做的)

试图添加:


df1 = df[df.gradient <= 0.1 & df.gradient >= -0.1]
plt.plot(df1.Timestamp,df1.Data, label="filter")

基于返回错误的this answermask之前:

TypeError: Cannot perform 'rand_' with a dtyped [float64] array and scalar of type [bool]

我觉得我做的不是很有效率。如何更有效地做到这一点


更新:

带代码

Timestamp = pd.date_range('2020-02-06 08:23:04', periods=1000, freq='s')
df = pd.DataFrame({'Timestamp': Timestamp,
                   'Data': 30+15*np.cos(np.linspace(0,10,Timestamp.size))})

df['timediff'] = (df['Timestamp'].shift(-1) - df['Timestamp']).dt.total_seconds()    
df['datadiff'] = df['Data'].shift(-1) - df['Data']
df['gradient'] = df['datadiff'] / df['timediff']

fig,ax = plt.subplots(figsize=(20,10))
df1 = df[(df.gradient <= 0.1) & (df.gradient >= -0.1)]
plt.plot(df1.Timestamp,df1.Data, label="filter")
plt.show()

它回来了 enter image description here

将范围更改为

df1 = df[(df.gradient <= 0.01) & (df.gradient >= -0.01)]

它回来了 enter image description here

为什么?


Tags: ptdfdatadateshiftnppltdatadiff
1条回答
网友
1楼 · 发布于 2024-05-20 05:28:01

在每个条件上添加括号,这样就可以逐行执行逻辑和

df1 = df[(df.gradient <= 0.1) & (df.gradient >= -0.1)]

并考虑使用一些散布,否则,梯度绝对值大于0.1的最新点将被连接。

plt.scatter(df1.Timestamp,df1.Data, label="filter")

这将是最终图像:

enter image description here

编辑

如果只需要渐变位于范围内的第一个点,请创建组,然后使用groupby

df['groups'] = ((df.gradient > 0.1) | (df.gradient < -0.1)).cumsum()

df2 = df[(df.gradient <= 0.1) & (df.gradient >= -0.1)]
    .groupby('groups').agg({'Timestamp':'first', 'Data':'first'})

#        Timestamp              Data
# groups        
# 0      2020-02-06 08:23:04    45.000000
# 168    2020-02-06 08:27:05    18.814188
# 336    2020-02-06 08:32:19    41.201294
# 504    2020-02-06 08:37:33    18.783251

相关问题 更多 >