cols = Germandata.columns
percentage_list = [0.05,0.01,0.1]
for i in range(len(Germandata)) :
for percentage in percentage_list:
columns_n = 3
random_columns = np.random.choice(cols, columns_n, replace=False)
local_data = Germandata.copy()
remove_n = int(round(local_data.shape[0] * percentage, 0))
for column_name in random_columns:
drop_indices = np.random.choice(local_data.index, remove_n, replace=False)
local_data.loc[drop_indices, column_name] = np.nan
这里的代码随机选择列,并将从数据中删除一定百分比的观察值,并将它们替换为NAN。这里的问题是,在运行循环后,我将在百分比列表中获得最终的删除百分比数据帧,因为它在每次迭代后都会被覆盖。如何在每次迭代后使用NAN存储数据帧。?理想情况下,我应该得到三个数据帧,其中删除的数据百分比不同
试试这个
或者,你可以使用字典
相关问题 更多 >
编程相关推荐