我有下面的代码读入csv文件(到dataset
数据帧)并将其转换成一个列表(到transactions
列表),由apriori算法处理。你知道吗
import pandas as pd
dataset = pd.read_csv('datasetFile.csv')
transactions = []
num_rows = 8000
num_cols = 20
for i in range(0, num_rows):
transactions.append([str(dataset.values[i,j]) for j in range(0, num_cols)])
.csv文件的格式为8000行,一行最多包含20个产品:
bread, butter
bread, milk, eggs, fruit
milk
eggs, milk, bread
上面的python代码适用于这个小数据集。但是,我当前的数据集有大约30万行和300列。如何改进这段python代码以将大型数据帧转换为列表?你知道吗
我认为需要筛选值,转换为numpy数组,然后再列出:
相关问题 更多 >
编程相关推荐