创建数据帧时Python在内存中出错

2024-07-04 17:22:39 发布

您现在位置:Python中文网/ 问答频道 /正文

嘿,伙计们

我在用Python创建数据集的过程中遇到了问题。 我在做这个:

 userTab = pd.read_csv('C:\\Users\\anto-\\Desktop\\Ex. 
 Resource\\mapping_user_id.tsv',delimiter="\t",names = 
 ["User","Sequence"])

 wordTab = pd.read_csv('C:\\Users\\anto-\\Desktop\\Ex. 
 Resource\\mapping_word_id.tsv',delimiter="\t",names = 
 ["Word","Sequence"])



 df = pd.DataFrame(data=data, index= userTab.User, columns=wordTab.Word)

我试图从两个元素创建一个数据集,用户选项卡。用户是一排wordTab.Word是columns元素。 也许这个形状太大了,不能用这种方法计算。 我打印了元素的形状,因为首先我认为我错了尺寸。在

((603668,),(37419,),(603668,37419))

之后,我尝试打印类型,我的user和word是Seris元素,data是scipy.sparse.csc.csc_矩阵

也许我需要用块来做这个形状,但是我看到了熊猫.DataFrame引用并且没有属性。在

我在64位Python上有一个8GB的Ram。稀疏矩阵在npz文件中(大约300mb)

错误为一般错误:

^{pr2}$

问题可能是这样的,因为我有一种ID,当我试图访问User列时,ID将保留在其中用户选项卡。用户在

enter image description here


Tags: csv数据用户元素readdatausersword

热门问题