Python中文
首页
教程
问答
标签
搜索
登录
注册
将大型SAS数据集转换为hdf5
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有多个大的(大于10GB)SAS数据集,我想转换为在pandas中使用,最好在HDF5中使用。有许多不同的数据类型(日期、数值、文本),一些数值字段也有不同的缺失值错误代码(例如,值可以是.,.e,.C等等),我希望保留列名和标签元数据。有没有人找到了一个有效的方法来做到这一点?在</p> <p>我尝试使用MySQL作为两者之间的桥梁,但是在传输时遇到了一些超出范围的错误,而且速度非常慢。我还尝试了从SAS以Stata.dta格式导出,但是SAS(9.3)以旧的Stata格式导出,该格式与pandas中的read_stat()不兼容。我也试过sas7bdat包,但从描述来看,它还没有被广泛测试过,所以我想用另一种方式加载数据集并比较结果,以确保一切正常工作。在</p> <p>额外细节:我要转换的数据集是来自CRSP、Compustat、IBES和WRDS中的TFN。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我以前没那么幸运。我们(在我工作的地方)只使用制表符分隔的文件在SAS和Python之间进行传输,而且我们经常这样做。在</p> <p>也就是说,如果您在Windows上,您可以尝试设置ODBC连接并以这种方式编写文件。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何修复设置.py尝试构建Visual Studio代码python解决方案时出错
8 回答
如何修复设置为检查哪些数字是素数的代码?
7 回答
如何修复设置的环境变量GDAL_DATA路径?
5 回答
如何修复访问“DJANGO_DEBUG”变量时的KeyError
5 回答
如何修复访问API时的“无效身份验证凭据”错误
7 回答
如何修复识别器。听着()在python中用于语音识别
10 回答
如何修复试图读取excel文件时被拒绝的[Errno13]权限?
8 回答
如何修复该函数,使生成的数据帧只包含子集列?
6 回答
如何修复语句弃用警告
2 回答
如何修复语法错误:不能在elemen上使用绝对路径
2 回答
如何修复语法错误:不能在Python上赋值给literal
9 回答
如何修复语法错误:无效语法?
9 回答
如何修复语法错误:无法分配给li
9 回答
如何修复语音识别器python3中的“权限错误:[Errno 13]”
10 回答
如何修复语音频道连接上的添加角色
7 回答
如何修复请求(urllib3)与app engine一起工作?
7 回答
如何修复请求中的“TypeError:'dict'object is not callable”(TypeError:'dict'对象不可调用)
2 回答
如何修复请求中的“启用javascript”错误?
6 回答
如何修复读取csv fi时的非法换行值
3 回答
如何修复读取JSON-fi时“list”对象没有属性“values”
8 回答