基于字符串中的子字符串的Python Pandas合并

df_search SEARCH part1 anotherpart onemorepart df_all FILE EXTENSION PATH part1_1 .prt //server/folder1/part1_1 part1_2 .prt //server/folder2/part1_2 part1_2 .pdf //server/folder3/part1_2 part1_3 .prt //server/folder2/part1_3 anotherpart_1 .prt //server/folder1/anotherpart_1 anotherpart_2 .prt //server/folder3/anotherpart_2 anotherpart_3 .prt //server/folder2/anotherpart_3 anotherpart_3 .cgm //server/folder1/anotherpart_3 anotherpart_4 .prt //server/folder3/anotherpart_4 onemorepart_1 .prt //server/folder2/onemorepart_1 onemorepart_2 .prt //server/folder1/onemorepart_2 onemorepart_2 .dwg //server/folder2/onemorepart_2 onemorepart_3 .prt //server/folder1/onemorepart_3 onemorepart_4 .prt //server/folder1/onemorepart_4

super_df = [] for search_item in df_search.search: df_entire.loc[df_entire.file.str.contains(search_item), 'search'] = search_item temp_df = df_entire[df_entire.file.str.contains(search_item)] super_df = pd.concat(super_df, axis=0, ignore_index=True)

2条回答

网友

1楼 · 编辑于 2024-10-01 11:31:08

使用^{}+^{}：

pat = "|".join(df_search.SEARCH)
df_all.insert(0, 'SEARCH', df_all['FILE'].str.extract("(" + pat + ')', expand=False))
print (df_all)
         SEARCH           FILE EXTENSION                            PATH
0         part1        part1_1      .prt        //server/folder1/part1_1
1         part1        part1_2      .prt        //server/folder2/part1_2
2         part1        part1_2      .pdf        //server/folder3/part1_2
3         part1        part1_3      .prt        //server/folder2/part1_3
4   anotherpart  anotherpart_1      .prt  //server/folder1/anotherpart_1
5   anotherpart  anotherpart_2      .prt  //server/folder3/anotherpart_2
6   anotherpart  anotherpart_3      .prt  //server/folder2/anotherpart_3
7   anotherpart  anotherpart_3      .cgm  //server/folder1/anotherpart_3
8   anotherpart  anotherpart_4      .prt  //server/folder3/anotherpart_4
9   onemorepart  onemorepart_1      .prt  //server/folder2/onemorepart_1
10  onemorepart  onemorepart_2      .prt  //server/folder1/onemorepart_2
11  onemorepart  onemorepart_2      .dwg  //server/folder2/onemorepart_2
12  onemorepart  onemorepart_3      .prt  //server/folder1/onemorepart_3
13  onemorepart  onemorepart_4      .prt  //server/folder1/onemorepart_4

网友

2楼 · 编辑于 2024-10-01 11:31:08

我会这样做：

df_all['SEARCH'] = ''
for val in df_search.SEARCH:
    df_all.loc[df_all['FILE'].str.match(val), 'SEARCH'] = val

相关问题更多 >

编程相关推荐

热门问题

热门文章