2024-09-27 07:32:31 发布
网友
这是我第一次使用Jupyter笔记本分析调查数据(.sav文件),我想以一种可以显示元数据的方式阅读它,这样我就可以将答案与问题联系起来。我在这个领域完全是个新手,所以非常感谢您的帮助
import pandas as pd import pyreadstat df, meta = pyreadstat.read_sav('./SimData/survey_1.sav') type(df) type(meta) df.head()
请lmk如果有一个额外的步骤需要我能够看到元数据
元对象包含您正在查找的元数据。最有用的属性可能是:
print(meta.column_names_to_labels)
print(meta.variable_value_labels)
例如,如果“性别”列的值为1和2,则可以得到: {“性别”:{1:“男性”,2:“女性”} 这意味着值1为男性,值2为女性。 如果传递参数apply\u value\u formats,则可以从头开始获取这些标签:
df, meta = pyreadstat.read_sav('survey.sav', apply_value_formats=True)
您还可以随时使用pyreadstat.set_value_labels将这些值格式应用于数据帧,该标签返回带有标签的数据帧副本:
df_copy = pyreadstat.set_value_labels(df, meta)
df, meta = pyreadstat.read_sav("survey.sav", user_missing=True) print(meta.missing_ranges) print(meta.variable_value_labels)
这些是对您的案例有用的潜在信息片段,不一定所有这些片段都会出现在您的数据集中
更多信息请参见:https://ofajardo.github.io/pyreadstat_documentation/_build/html/index.html
元对象包含您正在查找的元数据。最有用的属性可能是:
例如,如果“性别”列的值为1和2,则可以得到: {“性别”:{1:“男性”,2:“女性”} 这意味着值1为男性,值2为女性。 如果传递参数apply\u value\u formats,则可以从头开始获取这些标签:
您还可以随时使用pyreadstat.set_value_labels将这些值格式应用于数据帧,该标签返回带有标签的数据帧副本:
这些是对您的案例有用的潜在信息片段,不一定所有这些片段都会出现在您的数据集中
更多信息请参见:https://ofajardo.github.io/pyreadstat_documentation/_build/html/index.html
相关问题 更多 >
编程相关推荐