特定列索引上的Python数据帧连接?

2024-10-01 04:48:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个数据帧,它们的列名不同。我还没有找到一个使用两个不同名称或使用列索引的连接示例。你知道吗

fileDf = pd.read_csv(fileMeta, sep=delimiter, error_bad_lines=False)
lakeDf = pd.read_csv(lakeData, sep=delimiter, error_bad_lines=False)

在fileDF中我有索引7或DATASET\ ID。在lakeDF中我有TBL\ ID或要加入的索引0。当有两个不同的名称/索引时,我该怎么做?你知道吗

编辑:仍然没有合并,这里是.head()

-----------------file DF-------------------
   FILE_ID       CREATION_DT_TM entityType             FILE_LOCATION OWNER  \
0   268159  2015/08/12T03:52:58       File  /src/impacs/im_acct.dat/  null
1   268165  2015/08/22T05:03:51       File  /src/impacs/im_acct.dat/  null
2   268173  2015/07/18T04:48:12       File  /src/impacs/im_acct.dat/  null
3   268177  2015/09/09T05:17:03       File  /src/impacs/im_acct.dat/  null
4   268179  2015/07/28T04:31:06       File  /src/impacs/im_acct.dat/  null

  PUBLICATION_DT_TM    FILE_SIZE  DATASET_ID          last_modified NAV_ID  \
0              null  22095504000      578748  2015-10-07 08:16:48.0   null
1              null  22169091000      578748  2015-10-07 08:16:48.0   null
2              null  21933828000      578748  2015-10-07 08:16:48.0   null
3              null  22279575000      578748  2015-10-07 08:16:48.0   null
4              null  21994644000      578748  2015-10-07 08:16:48.0   null


[5 rows x 22 columns]
-----------------lake DF ------------------
   TBL_ID TBL_ADDITIONAL_INFO TBL_API TBL_ARCHIVECRITERIA  \
0  576781                null    null                null
1  576782                null    null                null
2  576783                null   false                null
3  576784                null    null                null
4  576785                null   false                null

Tags: csvsrc名称idreadnullsepdat
1条回答
网友
1楼 · 发布于 2024-10-01 04:48:51

您可以在lhs和rhs的不同列上进行合并,此外,您可能需要在案例中指定合并的类型,因为在lhs上有重复的值,然后您可以选择执行“left”^{}

fileDf.merge(lakeDf. left_on='DATESET_ID', right_index=True, how='left')

相关问题 更多 >