使用Pandas实现SAS到DB的转换

2024-09-30 19:33:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个sas7bdat格式的大型SAS数据集,我使用Pandas和SQLite3将其转换为一个.db文件,代码如下。在

df = pd.read_sas('file.sas7bdat')
con = sqlite3.connect('file.db')
df.to_sql(name='file', con=con, if_exists = 'replace', index=False)'

转换工作正常,但进程在看到字符串变量的任何地方(字符串之前和之后)都会添加额外的字符。所以如果它看到(B010),它就会把它转换成(b'B010')。我以后会用熊猫来剥去这些角色

^{pr2}$

但有太多的列有这样的错误,所以有没有一种方法可以在转换过程中解决这个问题呢?在


Tags: 文件数据字符串代码pandasdfdb格式