了解数据帧中数据类型的备份类型的简单方法

2024-09-30 12:28:38 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有一个复杂的数据框架,其中包含许多数据类型的列,包括多种大小的分类。是否有一个快速表达式输出所有这些列的backing(numpy)数据类型?例如,这意味着对于一个分类列,它将输出类似于int8int16等的内容,具体取决于引擎盖下使用的内容

我已经知道dataframes的.dtypes属性,但这并不是我想要的,因为它为每个分类打印出category,而不是打印反映用于表示特定分类的类型的内容(可以是1、2或4字节)

例如,对于此数据帧:

df = pd.DataFrame({'cat': pd.Categorical(['a', 'b', 'c'])})

我要查找的函数将输出这样的内容,即列cat最终在内存中由一个1字节的数字数组表示

编写这样的函数并不难,但也许有一种简单的单行方法(我找不到)。谢谢


Tags: 数据函数numpy框架内容字节表达式分类
1条回答
网友
1楼 · 发布于 2024-09-30 12:28:38

对于所有列,可以使用

dataframe.dtypes

import pandas as pd
df = pd.DataFrame({'A': [1,2,3], 'B': [True, False, False], 'C': ['a', 'b', 'c']})
print(df.dtypes)

A     int64                                                                                                                                                                                   
B      bool                                                                                                                                                                                   
C    object                                                                                                                                                                                   
dtype: object

相关问题 更多 >

    热门问题