根据索引和列名填充整个DataFrame单元格？

ae azde afgle arlde afghijklbcmde afghijklde 8 7 5 6 3 afghijklmde 9 8 6 7 2 ade 1 1 3 2 10 afghilmde 7 6 4 5 4 amde 2 1 3 2 9

2条回答

网友

1楼 · 编辑于 2024-09-29 22:25:30

你可以使用理解功能，在我的电脑上它的速度可以提高4.5倍

first = ['afghijklde', 'afghijklmde', 'ade', 'afghilmde', 'amde']
second = ['ae', 'azde', 'afgle', 'arlde', 'afghijklbcmde']
pd.DataFrame.from_dict({f:{s:edit_distance(f, s) for s in second} for f in first}, orient='index')

# output
#              ae  azde  afgle arlde  afghijklbcmde
# ade          1   2     2     2      2
# afghijklde   1   3     4     4      9
# afghijklmde  1   3     4     4      10
# afghilmde    1   3     4     4      8
# amde         1   3     3     3      3

# this matches to edit_distance('ae', 'afghijklde') == 8, e.g.

注：我使用此代码编辑_距离（您的链接中的第一个响应）：

^{pr2}$

网友

2楼 · 编辑于 2024-09-29 22:25:30

事实证明还有更好的方法。上面onepan的字典理解答案是好的，但是以随机顺序返回df索引和列。使用嵌套的.apply()可以以相同的速度完成相同的事情，并且不会改变行/列的顺序。关键是不要先为df的行和列命名，然后再填充值。相反，可以用另一种方法来做，首先将未来的索引和列作为独立的pandas系列来处理。在

series_rows = pd.Series(['afghijklde', 'afghijklmde', 'ade', 'afghilmde', 'amde'])
series_cols = pd.Series(['ae', 'azde', 'afgle', 'arlde', 'afghijklbcmde'])

df = pd.DataFrame(series_rows.apply(lambda x: series_cols.apply(lambda y: edit_distance(x, y))))
df.index = series_rows
df.columns = series_cols

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据索引和列名填充整个DataFrame单元格？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >