在数据框中创建一个新列,并将所有单元格设置为默认数组

2024-10-02 00:33:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图构建一个数据帧,其中一列表示一个向量。这是我遇到问题的代码部分:

tweets = pd.DataFrame(train_tweets)
tweets["LangClass"] = "und"
tweets["LangVec"] = pd.Series[[0,0,0,0,0,0,0,0,0,0]]

train_tweets是一个只有两列的传入数据帧,我想添加第三列和第四列LangClass和LangVec。LangVec中的值将逐元素更新

我通过使用for循环迭代数据帧并将LangVec的每个值设置为所需的向量来实现它,但这似乎是一种非常缓慢的方法

谢谢你的建议


Tags: 数据方法代码元素dataframefortrain向量
1条回答
网友
1楼 · 发布于 2024-10-02 00:33:59

我认为最好的方法是创建元组列表或列表列表,然后调用DataFrame构造函数:

L = []
for x in iterator:
    first_val = some_code_for_count_val
    second_val =  some_code_for_count_val
    L.append((first_val, second_val)) 

df1 = pd.DataFrame(L, columns = ['LangClass', 'LangVec'])

最后一次连接到原始数据帧:

df = df.join(df1)

相关问题 更多 >

    热门问题