大数据量下数据帧到列表的高效转换

2024-09-28 16:19:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我有下面的代码读入csv文件(到dataset数据帧)并将其转换成一个列表(到transactions列表),由apriori算法处理。你知道吗

import pandas as pd

dataset = pd.read_csv('datasetFile.csv')
transactions = []
num_rows = 8000
num_cols = 20
for i in range(0, num_rows):
    transactions.append([str(dataset.values[i,j]) for j in range(0, num_cols)])

.csv文件的格式为8000行,一行最多包含20个产品:

bread, butter
bread, milk, eggs, fruit
milk
eggs, milk, bread

上面的python代码适用于这个小数据集。但是,我当前的数据集有大约30万行和300列。如何改进这段python代码以将大型数据帧转换为列表?你知道吗


Tags: 文件csv数据代码in列表fordataset
1条回答
网友
1楼 · 发布于 2024-09-28 16:19:05

我认为需要筛选值,转换为numpy数组,然后再列出:

transactions = dataset.iloc[:num_rows, :num_cols].astype(str).values.tolist()

相关问题 更多 >