高效Pandas数据帧ins

2条回答

网友

1楼 · 编辑于 2024-09-29 01:36:59

使用列表理解首先对数据进行排序和提取。然后从已排序和清理的数据中创建数据帧。在

data = [[(1, 0.44), (2, 0.50), (3, 0.10)],
        [(2, 0.63), (1, 0.85), (3, 0.11)]]

# First, sort each row.
_ = [row.sort() for row in data]

# Then extract the second element of each tuple.
new_data = [[t[1] for t in row] for row in data]

# Now create a dataframe from your data.
>>> pd.DataFrame(new_data)
      0     1     2
0  0.44  0.50  0.10
1  0.85  0.63  0.11

网友

2楼 · 编辑于 2024-09-29 01:36:59

这可以使用字典（如果需要保留列顺序，或者列名是字符串）。也许亚历山大会更新他的答案来解释这一点，我几乎肯定他会有比我提议的更好的解决方案：）

下面是一个例子：

from collections import defaultdict

a = [[(1,0.44),(2,0.5),(3,0.1)],[(2,0.63),(1,0.85),(3,0.11)]]
b = [[('A',0.44),('B',0.5),('C',0.1)],[('B',0.63),('A',0.85),('C',0.11)]]

首先是：

^{pr2}$

和b：

row_to_dic = [{str(y[0]): y[1] for y in x} for x in b]

dd = defaultdict(list)
for d in (row_to_dic):
    for key, value in d.iteritems():
        dd[key].append(value)

pd.DataFrame.from_dict(dd)
      A     B   C
0   0.44    0.50    0.10
1   0.85    0.63    0.11

相关问题更多 >

编程相关推荐

热门问题

热门文章

高效Pandas数据帧ins

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >