我用Pandas(0.9.1)来编写物理代码。我有两个数据帧:
级别:
class 'pandas.core.frame.DataFrame'>
Int64Index: 37331 entries, 0 to 37330
Data columns:
atomic_number 37331 non-null values
ion_number 37331 non-null values
level_number 37331 non-null values
energy 37331 non-null values
g 37331 non-null values
metastable 37331 non-null values
线条:
^{pr2}$我有几件事要做: 我需要用线(原子、离子、能级)连接能级:首先是原子,离子,能级上的_数,然后是原子,离子,能级_数,更低。有没有一种方法可以预先计算连接内存不是问题,但速度是个问题。在
我还需要对能级(原子,离子)进行分组,并对能级进行运算。我已经这样做了(难以置信的快),但是在将结果系列与lines dataframe连接起来时遇到了困难。在
我该怎么做?在
干杯 沃尔夫冈
更新v1:
若要显示我要加入的内容,请在此处合并一段代码
def calc_group_func(group):
return np.sum(group['g']*np.exp(-group['energy'])
grouped_data = levels.group_by('atomic_number', 'ion_number')
grouped_data.apply(calc_group_func)
然后我想用原子序数和离子数的行来连接/合并分组数据
也许有更好的方法,但是也许数据框合并()会在这里工作。数据框合并()在两个数据帧上工作,因此在apply()之后的一系列中,为每个(atom,ion)对计算的值需要首先放在一个数据帧中,此时还可以指定最后的列名。在
相关问题 更多 >
编程相关推荐