如何在Pandas数据框架内进行不确定性传播（地球化学数据缩减）

york = {'date':['Jun27', 'Jun28', 'Jun29', 'Jun30'], 'a':[1.2013, 1.0057, 1.1462, 0.3874], 'b':[44138,41246,43311,49830], 'siga':[0.2795,0.2791,0.2189,0.3641], 'sigb':[531.7,873.7,727.26,1251.7]} yk = pd.DataFrame(york) yk.set_index('date', inplace = True)

Jun30 = {'File':['LB13-LP41-10-ZR.asc', 'LB13-LP41-19-ZR.asc', 'LB13-MB50-1-ZR.asc', 'LB13-MB50-18ZR.asc'], '49Ti/30Si16O':[0.000405567, 0.000272094, 0.000320981, 0.000153742], '1 se err':[2.61586E-06, 7.65216E-07, 1.32338E-06, 1.53561E-06]} df30 = pd.DataFrame(Jun30) df30.set_index('File', inplace = True)

RTi = [data for Ti ratio] RTierr = [associated errors] %etc... N = numel(RTi) Ti = zeros(N,1); Tierr = zeros(N,1); for i = 1:N j = zeros(1e5,1); k = zeros(1e5,1); for n = 1:1e5 a(n) = normrnd(intercept,sigintercept); b(n) = normrnd(slope,sigslope); k(n) = normrnd(RTi,RTierr); j(n) = k(n).*b(n)+a(n) end Ti(i) = mean(j); Tierr(i) = std(j); end

1条回答

网友

1楼 · 发布于 2024-10-05 11:25:51

以下列形式提供数据：

Jun27 = {'File':['LB13-LP41-10-ZR.asc', 'LB13-LP41-19-ZR.asc', 'LB13-MB50-1-ZR.asc', 'LB13-MB50-18ZR.asc'],
         '49Ti/30Si16O':[0.000405567, 0.000272094, 0.000320981, 0.000153742],
         '1 se err':[2.61586E-06, 7.65216E-07, 1.32338E-06, 1.53561E-06], 'date': 'Jun27'}
Jun28 = {'File':['LB13-LP41-10-ZR.asc', 'LB13-LP41-19-ZR.asc', 'LB13-MB50-1-ZR.asc', 'LB13-MB50-18ZR.asc'],
         '49Ti/30Si16O':[0.000405567, 0.000272094, 0.000320981, 0.000153742],
         '1 se err':[2.61586E-06, 7.65216E-07, 1.32338E-06, 1.53561E-06], 'date': 'Jun28'}
Jun29 = {'File':['LB13-LP41-10-ZR.asc', 'LB13-LP41-19-ZR.asc', 'LB13-MB50-1-ZR.asc', 'LB13-MB50-18ZR.asc'],
         '49Ti/30Si16O':[0.000405567, 0.000272094, 0.000320981, 0.000153742],
         '1 se err':[2.61586E-06, 7.65216E-07, 1.32338E-06, 1.53561E-06], 'date': 'Jun29'}
Jun30 = {'File':['LB13-LP41-10-ZR.asc', 'LB13-LP41-19-ZR.asc', 'LB13-MB50-1-ZR.asc', 'LB13-MB50-18ZR.asc'],
         '49Ti/30Si16O':[0.000405567, 0.000272094, 0.000320981, 0.000153742],
         '1 se err':[2.61586E-06, 7.65216E-07, 1.32338E-06, 1.53561E-06], 'date': 'Jun30'}

只提供了一天的数据，因此在本例中，该天已用于所有天

收集所有数据：

data = pd.concat([pd.DataFrame(Jun27), pd.DataFrame(Jun28), pd.DataFrame(Jun29), pd.DataFrame(Jun30)])

注意添加了date列

合并`yk`（来自示例）和`data`：

df = pd.merge(yk, data)

使用相同的DataFrame中的所有数据执行计算更容易
合并在两个DataFrames中包含的date列上

创建计算：

df['Ti'] = df['49Ti/30Si16O'] * df.b + df.a

df['49Ti/30Si16O_error_min'] = df['49Ti/30Si16O'] - df['1 se err']
df['49Ti/30Si16O_error_max'] = df['49Ti/30Si16O'] + df['1 se err']
df['b_error_min'] = df.b - df.sigb
df['b_error_max'] = df.b + df.sigb
df['a_error_min'] = df.a - df.siga
df['a_error_max'] = df.a + df.siga
df['Ti_min'] = df['49Ti/30Si16O_error_min'] * df['b_error_min'] + df['a_error_min']
df['Ti_max'] = df['49Ti/30Si16O_error_max'] * df['b_error_max'] + df['a_error_max']

以下列形式提供数据：

收集所有数据：

合并`yk`（来自示例）和`data`：

创建计算：

相关问题更多 >

编程相关推荐

热门问题

热门文章