在Python中压缩大表最有效的方法是什么

2条回答

网友

1楼 · 编辑于 2024-09-27 02:26:35

可以使用python集进行聚合：

df.groupby('col1', as_index=False).agg(set)

以下是一个虚拟示例，因为您没有以文本形式提供数据集：

输入：

  col1 col2  col3
0    A    a     0
1    A    b     1
2    A    a     2
3    B    b     1
4    B    a     2
5    B    d     1
6    C    a     0
7    C    c     1
8    C    b     0

输出：

  col1       col2       col3
0    A     {b, a}  {0, 1, 2}
1    B  {d, b, a}     {1, 2}
2    C  {b, a, c}     {0, 1}

网友

2楼 · 编辑于 2024-09-27 02:26:35

你很可能会想用熊猫来做这件事，因为这就是它建造的目的

import pandas as pd
df = pd.read_csv("/path/to/your/data.csv")
df = df.groupby('SFN').agg(set).reset_index()

我认为这应该适用于您的示例，但由于您没有提供数据，我没有对其进行测试

编程相关推荐

java Switch语句，用于根据用户输入确定字母等级（十进制）
使用rich:datascroller更改页面后，java actionListener无法在rich:dataTable中工作
使用Azure AD帐户时java强制密码更改问题
java如何在flink中模拟异步操作
java如何将整数格式化为两个小数？
基于javascript条件访问amazon lamda结果？
java成本/从源节点到目标节点的所有可能路径的距离
java为什么我的光标在NextLine（）之后的错误行上？
java Gridlayout未根据约束调整大小
windows使用特殊路径名在java中加载文件

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中压缩大表最有效的方法是什么

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >