如何从csv/tsv加载Pandas数据帧作为factorize类别类型？

data = pd.read_table("biallelic-only.raw") categorical_feats = [ f for f in data.columns if f not in ['FID', 'IID', 'PAT', 'MAT', 'bmi'] ] categorical_feats for f in categorical_feats: data[f], _ = pd.factorize(data[f]) data[f] = data[f].astype('category')

1条回答

网友

1楼 · 发布于 2024-09-28 17:26:27

以分类方式读取数据，并为异常列指定转换器，例如，假设名为'data.csv'的玩具文件包含以下数据：

name  type   cost
AB     B      1
CV     G      4
54     B      31
AB     B      2

你可以做：

import pandas as pd

df = pd.read_csv('data.csv', dtype='category', converters={'cost': int}, delim_whitespace=True)
print(df.dtypes)

输出

name    category
type    category
cost       int64
dtype: object

在上面的例子中，cost是exception列，在您的例子中，它应该是['FID', 'IID', 'PAT', 'MAT', 'bmi']。请注意，转换器字典将取决于您的数据类型（在示例中cost是一个整数列）

编程相关推荐

尝试连接到Red5服务器时出现java问题
java实现Runnable的类被认为是ExecutorServices的“Runnable任务”？
java struts2类中的多个@validation
java未能应用插件[class'org.gradle.api.plugins.scala.ScalaBasePlugin']：gradle v2。13
如何使用Java流仅收集长度最大的元素？
从spring引导应用程序连接到firestore的java引发空指针异常
java从SQLite插入和获取真实数据类型会为连续插入获取空值吗？
当存在未知数量的空格时，使用java替代正向查找
部署如何为当今的浏览器部署java小程序（小程序、嵌入、对象）？
@OneToMany和@ManyToOne@Formula之间的java双向关系返回null

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从csv/tsv加载Pandas数据帧作为factorize类别类型？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >