to-sql pyodbc count字段不正确或语法错误

2条回答

网友

1楼 · 编辑于 2024-10-01 17:32:07

更新：

pandas 0.23.1恢复了0.23.0中引入的有问题的更改。但是，对于原始性能的最佳解决方案仍然是CSV->；bcp方法，如下所述。在

更新：

熊猫0.24.0显然重新引入了这个问题（参考文献：here）

（原始答案）

在pandas版本0.23.0之前，to_sql将为DataTable中的每一行生成一个单独的INSERT：

exec sp_prepexec @p1 output,N'@P1 int,@P2 nvarchar(6)',
    N'INSERT INTO df_to_sql_test (id, txt) VALUES (@P1, @P2)',
    0,N'row000'
exec sp_prepexec @p1 output,N'@P1 int,@P2 nvarchar(6)',
    N'INSERT INTO df_to_sql_test (id, txt) VALUES (@P1, @P2)',
    1,N'row001'
exec sp_prepexec @p1 output,N'@P1 int,@P2 nvarchar(6)',
    N'INSERT INTO df_to_sql_test (id, txt) VALUES (@P1, @P2)',
    2,N'row002'

大概是为了提高性能，pandas 0.23.0现在生成一个表值构造函数，以便在每次调用中插入多行

^{pr2}$

问题是SQLServer存储过程（包括系统存储过程，如sp_prepexec）被限制为2100个参数，因此，如果DataFrame有100列，to_sql一次只能插入大约20行。在

我们可以使用

# df is an existing DataFrame
#
# limit based on sp_prepexec parameter count
tsql_chunksize = 2097 // len(df.columns)
# cap at 1000 (limit for number of rows inserted by table-value constructor)
tsql_chunksize = 1000 if tsql_chunksize > 1000 else tsql_chunksize
#
df.to_sql('tablename', engine, if_exists='replace', index=False, chunksize=tsql_chunksize)

然而，最快的方法仍然可能是：

将数据帧转储到CSV文件（或类似文件），然后
让Python调用sqlserverbcp实用程序将该文件上载到表中。

网友

2楼 · 编辑于 2024-10-01 17:32:07

根据戈德汤普森的回答做了一些修改。这将自动计算chunksize并将其保持为符合2100参数限制的最小最近整数值：

import math
df_num_of_cols=len(df.columns)
chunknum=math.floor(2100/df_num_of_cols)
df.to_sql('MY_TABLE',con=engine,schema='myschema',chunksize=chunknum,if_exists='append',method='multi',index=False )

相关问题更多 >

编程相关推荐

热门问题

热门文章

to-sql pyodbc count字段不正确或语法错误

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >