2024-09-30 16:30:21 发布
网友
在读取csv文件时,pandas可以识别dataframe中哪些列是分类的,而不需要我们显式地指定列。 类似于R中的StringAsFactor。 我尝试过搜索,但得到的结果是要么我们将列创建为分类列,要么指定在读取文件时将哪个列视为分类列。我需要熊猫来辨认。 任何帮助都将不胜感激。提前谢谢!!在
是的。在使用read_*加载列时,可以指定哪些列属于分类类型。例如,考虑一个CSV-
read_*
Col a b c a b b c
现在,用read_csv读这个,指定一个dtype参数-
read_csv
dtype
df['Col'] 0 a 1 b 2 c 3 a 4 b 5 b 6 c Name: Col, dtype: category Categories (3, object): [a, b, c]
如果您有未知数量的分类列,可以读入它们,然后逐个转换它们-
df = pd.read_csv('file.csv') for c in df.columns[df.dtypes == object]: # df.dtypes == 'object' df[c] = df[c].astype('category')
是的。在使用
read_*
加载列时,可以指定哪些列属于分类类型。例如,考虑一个CSV-现在,用
^{pr2}$read_csv
读这个,指定一个dtype
参数-如果您有未知数量的分类列,可以读入它们,然后逐个转换它们-
相关问题 更多 >
编程相关推荐