嘿,伙计们
我在用Python创建数据集的过程中遇到了问题。 我在做这个:
userTab = pd.read_csv('C:\\Users\\anto-\\Desktop\\Ex.
Resource\\mapping_user_id.tsv',delimiter="\t",names =
["User","Sequence"])
wordTab = pd.read_csv('C:\\Users\\anto-\\Desktop\\Ex.
Resource\\mapping_word_id.tsv',delimiter="\t",names =
["Word","Sequence"])
df = pd.DataFrame(data=data, index= userTab.User, columns=wordTab.Word)
我试图从两个元素创建一个数据集,用户选项卡。用户是一排wordTab.Word是columns元素。 也许这个形状太大了,不能用这种方法计算。 我打印了元素的形状,因为首先我认为我错了尺寸。在
((603668,),(37419,),(603668,37419))
之后,我尝试打印类型,我的user和word是Seris元素,data是scipy.sparse.csc.csc_矩阵
也许我需要用块来做这个形状,但是我看到了熊猫.DataFrame引用并且没有属性。在
我在64位Python上有一个8GB的Ram。稀疏矩阵在npz文件中(大约300mb)
错误为一般错误:
^{pr2}$问题可能是这样的,因为我有一种ID,当我试图访问User列时,ID将保留在其中用户选项卡。用户在
目前没有回答
相关问题 更多 >
编程相关推荐