Pandas基于最近匹配合并数据帧

df_a N0_YLDF 0 11.79 1 7.86 2 5.78 3 5.35 4 6.32 5 11.79 6 6.89 7 10.74 df_b N0_YLDF N0_DWOC 0 6.29 4 1 2.32 4 2 9.10 4 3 4.89 4 4 10.22 4 5 3.80 3 6 5.55 3 7 6.36 3

2条回答

网友

1楼 · 编辑于 2024-10-01 13:46:15

另一种方法是减去笛卡尔积中的所有对，然后得到每对的最小绝对值索引：

In [47]:ix = abs(np.atleast_2d(df_a['N0_YLDF']).T - df_b['N0_YLDF'].values).argmin(axis=1)
        ix
Out[47]: array([4, 2, 6, 6, 0, 4, 7, 4])

那就去吧

^{pr2}$

网友

2楼 · 编辑于 2024-10-01 13:46:15

您可以在df_b['N0_YLDF']中找到介于（排序）值中间的截止值。然后调用pd.cut对df_a['N0_YLDF']中的值进行分类，截断值为bin边：

import numpy as np
import pandas as pd

df_a = pd.DataFrame({ 'N0_YLDF': [11.79, 7.86, 5.78, 5.35, 6.32, 11.79, 6.89, 10.74]})
df_b = pd.DataFrame({ 'N0_YLDF':[6.29, 2.32, 9.10, 4.89, 10.22, 3.80, 5.55, 6.36] })

edges, labels = np.unique(df_b['N0_YLDF'], return_index=True)
edges = np.r_[-np.inf, edges + np.ediff1d(edges, to_end=np.inf)/2]
df_a['N0_DWOC'] = pd.cut(df_a['N0_YLDF'], bins=edges, labels=df_b.index[labels])
print(df_a)

收益率

^{pr2}$

要连接N0_DWOC上的两个数据帧，可以使用：

print(df_a.join(df_b, on='N0_DWOC', rsuffix='_b'))

它产生了

   N0_YLDF N0_DWOC  N0_YLDF_b
0    11.79       4      10.22
1     7.86       2       9.10
2     5.78       6       5.55
3     5.35       6       5.55
4     6.32       0       6.29
5    11.79       4      10.22
6     6.89       7       6.36
7    10.74       4      10.22

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas基于最近匹配合并数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >