我有一个非常大的数据集(大约600000行)。我希望在前四列相同的情况下,通过在最后一列中创建数组来减少数据行数
make year model engine part
alfa romeo 1960 giulietta 1.3l l4 A
alfa romeo 1958 giulietta 1.3l l4 B
alfa romeo 1958 giulietta 1.3l l4 A
alfa romeo 1957 giulietta 1.3l l4 B
alfa romeo 1957 giulietta 1.3l l4 A
alfa romeo 1956 giulietta 1.3l l4 B
alfa romeo 1956 giulietta 1.3l l4 A
alfa romeo 1954 giulietta 1.3l l4 B
alfa romeo 1954 giulietta 1.3l l4 A
alfa romeo 1955 giulietta 1.3l l4 B
alfa romeo 1955 giulietta 1.3l l4 A
所需输出:
make year model engine part
alfa romeo 1960 giulietta 1.3l l4 [A]
alfa romeo 1958 giulietta 1.3l l4 [A,B]
alfa romeo 1957 giulietta 1.3l l4 [A,B]
alfa romeo 1956 giulietta 1.3l l4 [A,B]
alfa romeo 1955 giulietta 1.3l l4 [A,B]
alfa romeo 1954 giulietta 1.3l l4 [A,B]
我想我可以使用dataframe.groupby
来获得我想要的输出,但是我无法通过多次尝试来实现。我一直收到以下输出的一种形式<pandas.core.groupby.generic.DataFrameGroupBy object at xxx>
任何帮助都将不胜感激
将它们分组并列出它们的内容
您可以分组,然后制作零件列表
样本输出:
相关问题 更多 >
编程相关推荐