将每个项与中的最后一个非空值配对

import pandas as pd import numpy as np csv1 = pd.read_csv('Example_301_sheet.csv', header=None) outlist = [] def link_flat(csv): for row in csv.iterrows(): index, data = row outlist.append(data.tolist()) return outlist

[['example.com/url1', 'example.com/url2', nan, nan], ['example.com/url3', 'example.com/url4', 'example.com/url5', nan], ['example.com/url6', 'example.com/url7', 'example.com/url8', 'example.com/10'], ['example.com/url9', 'example.com/url7', 'example.com/url8', nan], ['example.com/url23', 'example.com/url10', nan, nan], ['example.com/url24', 'example.com/url45', 'example.com/url46', nan], ['example.com/url25', 'example.com/url45', 'example.com/url46', nan], ['example.com/url26', 'example.com/url45', 'example.com/url46', nan], ['example.com/url27', 'example.com/url45', 'example.com/url46', nan], ['example.com/url28', 'example.com/url45', 'example.com/url46', nan], ['example.com/url29', 'example.com/url45', 'example.com/url46', nan], ['example.com/url30', 'example.com/url45', 'example.com/url46', nan]]

1条回答

网友

1楼 · 发布于 2024-10-03 06:19:07

您需要使用groupby+last确定每行的最后一个有效项，然后重塑数据帧并使用melt构建两列映射

df.columns = range(len(df.columns))
df = (
    df.assign(URL2=df.stack().groupby(level=0).last())
      .melt('URL2', value_name='URL1')  
      .drop('variable', 1)
      .dropna()
      .drop_duplicates()
      .query('URL1 != URL2')
      .sort_index(axis=1)
      .reset_index(drop=True)
)

df
                 URL1               URL2
0    example.com/url1   example.com/url2
1    example.com/url3   example.com/url5
2    example.com/url6     example.com/10
3    example.com/url9   example.com/url8
4   example.com/url23  example.com/url10
5   example.com/url24  example.com/url46
6   example.com/url25  example.com/url46
7   example.com/url26  example.com/url46
8   example.com/url27  example.com/url46
9   example.com/url28  example.com/url46
10  example.com/url29  example.com/url46
11  example.com/url30  example.com/url46
12   example.com/url4   example.com/url5
13   example.com/url7     example.com/10
14   example.com/url7   example.com/url8
15  example.com/url45  example.com/url46
16   example.com/url8     example.com/10

相关问题更多 >

编程相关推荐

热门问题

热门文章