从Pandas DataFram中提取多个非连续索引值

2条回答

网友

1楼 · 编辑于 2024-05-08 15:34:23

你的输入文件是big-endian。请参阅此处转换它：http://pandas.pydata.org/pandas-docs/dev/gotchas.html#byte-ordering-issues

前后比较

In [7]: df.dtypes
Out[7]: 
a        >f4
b        >f4
c        >f4
shots    >f4
dtype: object

In [9]: df.apply(lambda x: x.values.byteswap().newbyteorder())
Out[9]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 100 entries, 20000 to 20099
Data columns (total 4 columns):
a        100  non-null values
b        100  non-null values
c        100  non-null values
shots    100  non-null values
dtypes: float32(4)

In [10]: df.apply(lambda x: x.values.byteswap().newbyteorder()).dtypes
Out[10]: 
a        float32
b        float32
c        float32
shots    float32
dtype: object

也可以在完成此操作后设置索引（例如，不要在构造函数中这样做）

^{pr2}$

网友

2楼 · 编辑于 2024-05-08 15:34:23

从你的意见来看，我将以以下方式处理这个问题：

values_i_want = [19999, 20000, 20005, 20007]
subset = df.select(lambda x: x[0] in values_i_want)

如果您的数据帧非常大（听起来很像），那么select方法可能会非常慢。在这种情况下，另一种方法是循环使用values_i_want获取横截面（df.xs(val, level=0），并将它们附加到输出数据帧中。换句话说（未经测试）：

^{pr2}$

不知道是否会更快。但是如果select方法太慢，那么值得一试。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

从Pandas DataFram中提取多个非连续索引值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >