在Python中使用Pandas拆分数据集

2024-05-20 14:37:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个清单:

ac = [2,3,4]

我想要数据帧中的所有东西,除了列表ac中提到的行

我试过:

dataframe.iloc[:-a, :]

但我错了。你知道吗

我该怎么办?你知道吗


Tags: 数据dataframe列表aciloc
1条回答
网友
1楼 · 发布于 2024-05-20 14:37:08

我相信默认的RangeIndex需要通过列表ac通过^{}获取索引值的值,并通过^{}选择:

df = pd.DataFrame({'A':list('abcdef'),
                   'B':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'D':[1,3,5,7,1,0],
                   'E':[5,3,6,9,2,4],
                   'F':list('aaabbb')})

print (df)
   A  B  C  D  E  F
0  a  4  7  1  5  a
1  b  5  8  3  3  a
2  c  4  9  5  6  a
3  d  5  4  7  9  b
4  e  5  2  1  2  b
5  f  4  3  0  4  b

ac = [2,3,4]
idx = df.index.difference(ac)
df = df.loc[idx]

print (df)
   A  B  C  D  E  F
0  a  4  7  1  5  a
1  b  5  8  3  3  a
5  f  4  3  0  4  b

^{}^{}在列表ac中定义并按^{}选择的按位置筛选的所有索引的一般解决方案:

df = pd.DataFrame({'A':list('abcdef'),
                   'B':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'D':[1,3,5,7,1,0],
                   'E':[5,3,6,9,2,4],
                   'F':list('aaabbb')}, index=list('ABCDEF'))

print (df)
   A  B  C  D  E  F
A  a  4  7  1  5  a
B  b  5  8  3  3  a
C  c  4  9  5  6  a
D  d  5  4  7  9  b
E  e  5  2  1  2  b
F  f  4  3  0  4  b

ac = [2,3,4]
pos = np.setdiff1d(np.arange(len(df.index)), ac)
df = df.iloc[pos]
print (df)
   A  B  C  D  E  F
A  a  4  7  1  5  a
B  b  5  8  3  3  a
F  f  4  3  0  4  b

相关问题 更多 >