Python：计算列中每个值有效的概率

2条回答

网友

1楼 · 编辑于 2024-05-09 08:28:17

找到我的错误，这是我问题的答案：

df= pd.DataFrame(columns=['No','quantity'], data=[[1,100.0],[2,102.3],[3,301.3],[4,101.3],[5,101.3],[6,120.3]])

df['z'] = (df.quantity - df.quantity.mean())/df.quantity.std(ddof=0)
mu = np.mean(df.quantity)
sig = df.quantity.std()
df['prob'] = 0.0

for idx,row in df.iterrows():
    if row.quantity < mu:
        df.at[idx,'prob'] = 1 - (scipy.stats.norm(mu,sig).pdf(row.quantity))
    else:
        df.at[idx,'prob'] = scipy.stats.norm(mu, sig).pdf(row.quantity)

输出为：

^{pr2}$

网友

2楼 · 编辑于 2024-05-09 08:28:17

关于您的解决方案的一些意见：如果您已经在使用scipy，那么您可以使用scipy.stats.mstats.zscore而不是编写自己的zscore计算，并且不需要导入numpy来计算pandas系列的平均值：

df= pd.DataFrame(columns=['No','quantity'], data=[[1,100.0],[2,102.3],[3,301.3],[4,101.3],[5,101.3],[6,120.3]])
mu=df.quantity.mean()
sig=df.quantity.std()
df['z']=scipy.stats.mstats.zscore(df.quantity)
df['prob'] = 0.0

for idx,row in df.iterrows():
    if row.quantity < mu:
        df.at[idx,'prob'] = 1 - (scipy.stats.norm(mu,sig).pdf(row.quantity))
    else:
        df.at[idx,'prob'] = scipy.stats.norm(mu, sig).pdf(row.quantity)

您还可以使用apply避免在数据帧上进行迭代：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python：计算列中每个值有效的概率

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >