将签名上的数据帧行与中的公差匹配

2024-07-08 10:45:57 发布

男 | 程序猿一只，喜欢编程写python代码。

我有以下数据帧：

df1 = pd.DataFrame(columns=["DATE","QTY1", "QTY2", "ID", "CODE"])
df1["DATE"] = ["2000-05-01", "2000-05-03", "2001-01-15", "2001-02-20", "2001-02-22"]
df1["QTY1"] = [10, 11, 12,5,4]
df1["QTY2"] = [100, 101, 102,15,14]
df1["ID"] = [1,2,3,4,5]
df1["CODE"] = ["A", "B", "C", "D", "E"]
df2 = pd.DataFrame(columns=["DATE","QTY1", "QTY2", "ID", "CODE"])
df2["DATE"] = ["2000-05-02", "2000-05-04", "2001-01-12", "2001-03-28", "2001-08-21", "2005-07-01"]
df2["QTY1"] = [9, 101, 11,5.1,100, 10]
df2["QTY2"] = [99, 12, 1000,6,3, 1]
df2["ID"] = [1,2,3,8,5, 9]
df2["CODE"] = ["F", "G", "H", "I", "L", "M"]

df1:
   DATE          QTY1  QTY2  ID CODE
0  2000-05-01    10   100   1    A
1  2000-05-03    11   101   2    B
2  2001-01-15    12   102   3    C
3  2001-02-20     5    15   4    D
4  2001-02-22     4    14   5    E

df2
   DATE          QTY1  QTY2  ID CODE
0  2000-05-02    9.0    99   1    F
1  2000-05-04  101.0    12   2    G
2  2001-01-12   11.0  1000   3    H
3  2001-03-28    5.1     6   8    I
4  2001-08-21  100.0     3   5    L
5  2005-07-01     10     1   9    M

我的目标是为每一行创建一个具有一定容差的签名，并匹配在这样的间隔内的两个DF上的行。每行的签名结构如下：

日期（公差+/-5天）
Qty1（公差10%）
Qty2（公差10%）
ID（完美匹配）。你知道吗

例如，上述DF的匹配结果将返回按签名分组的以下行（每个DF的第一行）：

Signature1    2000-05-01    10   100   1     A
              2000-05-02    9.0    99   1    F

所有其他行不考虑一个或多个公差。你知道吗

目前，我正在使用一个经典的for循环，使用iterrows（）检查所有字段，但是对于大型DFs，性能非常差。我想知道是否有一个更像熊猫的方法，可以帮助我加快它。谢谢

Tags： columns 数据 id 目标 dataframe df date 间隔

0条回答

目前没有回答

将签名上的数据帧行与中的公差匹配

相关问题更多 >

编程相关推荐

热门问题

热门文章

将签名上的数据帧行与中的公差匹配

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >