Python Pandas数据帧vs dict vs lis

2024-09-30 20:25:35 发布

您现在位置:Python中文网/ 问答频道 /正文

所以,我正在编写一个巨大的模块,其中我调用了10个其他模块。这些“10个其他模块”将参考数据存储为列表列表。在

例如,我有一个模块refdataCollection.py有这些数据,每一项都不超过100项。在

allFees = [['FeeID','RegFees',''HXVFees'],
['ABC',34,21],
['ABV',31,23],
['PGC',33,25],]

allCust = [['CustID','CustCode',''CustName'],
['1','ARN','Company 1'],
['2','BRS','Company 2'],
['3','AJN','Company 3'],]

在我的主模块课程中,我会像这样调用这些模块:

^{pr2}$

然后在主模块中,我可以得到如下值:

feesDataFrame = getRefDataDataFrame('allFees')
thisFee = feesDataFrame[ (feesDataFrame['FeeID'] == 'ABC')]

考虑到我有多个方法调用多个这样的ref数据,我可能会做100次。在

问题是: 使用数据帧是正确的方法吗?对于如此小的数据集,我是否应该使用列表或dict而不是pandas?我的方法是花很多时间,有些是几秒钟来遍历一组50K的记录。在


Tags: 模块数据方法py列表companyabcabv