TypeError:使用groupby生成组合时

from collections import Counter from itertools import groupby, combinations import pandas #now we will use a generator instead of dicts to save memory def generate_pairs(orders, k): #generate item list for order for id, order in groupby(orders, lambda x: x[0]): items = [item[0] for item in order] #generate pairs for each itemlist for pair in combinations(items, k): yield pair def itemcount(iterable): if type(iterable) == pandas.core.series.Series: return iterable.value_counts().rename("count") else: return pandas.Series(Counter(iterable)).rename("count")

Traceback (most recent call last): File "C:/Users/Cosco/PycharmProjects/untitled/finalp/final.py", line 183, in <module> rules = generate_rules(transactions, supp_percent) File "C:/Users/Cosco/PycharmProjects/untitled/finalp/final.py", line 80, in generate_rules pairs = itemcount(pair_generator).to_frame("count(AB)") File "C:/Users/Cosco/PycharmProjects/untitled/finalp/final.py", line 33, in itemcount print(type(pandas.Series(Counter(iterable)).rename("count"))) File "C:\Users\Cosco\Miniconda3\lib\collections\__init__.py", line 534, in __init__ self.update(*args, **kwds) File "C:\Users\Cosco\Miniconda3\lib\collections\__init__.py", line 621, in update _count_elements(self, iterable) File "C:/Users/Cosco/PycharmProjects/untitled/finalp/final.py", line 22, in generate_pairs for id, order in groupby(orders, lambda x: x[0]): File "C:/Users/Cosco/PycharmProjects/untitled/finalp/final.py", line 22, in <lambda> for id, order in groupby(orders, lambda x: x[0]): TypeError: 'int' object is not subscriptable

def generate_pairs(orders, k): orders = orders.reset_index().values #generate item list for order for id, order in groupby(orders, lambda x: x[0]): itemlist = [item[1] for item in order] #generate pairs for each itemlist for pair in combinations(itemlist, k): yield pair

1条回答

网友

1楼 · 发布于 2024-06-28 11:06:04

你假设熊猫DataFrames像列表一样工作，但它们不是

您可以这样修改程序：

def generate_pairs(orders, k):
    orders = orders.values.tolist()
    ...

但请记住，您将无法访问generate_pairs中的标签或格式

注意：您也可以逃脱orders = orders.values的惩罚-这将避免O(n)复制数据（从numpy到PyList），但如果您希望orders的类型正好是一个列表，则可能会出现问题

相关问题更多 >

编程相关推荐

热门问题

热门文章