我已经下载了dataframe,并尝试从此dataframe创建pd.Series
data = pd.read_csv(filepath_or_buffer = "train.csv", index_col = 0)
data.columns
Index([u'qid1',u'qid2',u'question1',u'question2'], dtype = 'object')
这里是数据帧中的列,qid1
是question1
的ID,qid2
是question2
的ID
此外,我的数据帧中没有Nan
:
data.question1.isnull().sum()
0
我想从第一个问题创建pandas.Series(),以qid1
作为索引:
question1 = pd.Series(data.question1, index = data.qid1)
question1.isnull.sum()
68416
现在,在我的系列中有68416个空值。我的错在哪里
传递匿名值,以便
Series
向量不尝试对齐:这里的问题是
question1
列有它自己的索引,所以它将在构造期间尝试使用它例如:
实际上,这里发生的情况是,您正在使用传入的新索引对现有列重新编制索引,因为没有与您得到的
NaN
匹配的索引值相关问题 更多 >
编程相关推荐