我使用pandasql在Jupyter笔记本电脑中工作,它使用SQLight语法。我试图根据变量从某个月选择条目。我计划创建一个Python函数,它将更改所使用变量的值,但现在我正在尝试让“参数化查询”工作
我的表有DATE PAYED, PAYEE, AMOUNT
列
这就是我的SQL查询的样子:
varMonth= "01"
q = """
SELECT
*,
strftime('%m', "DATE DUE") as "months"
FROM
year2020
WHERE
"months" = "01"
"""
test2020 = sqldf(q, globals())
上述代码成功地选择了1月份的所有条目。我想更改WHERE条件以与变量varMonth
进行比较
我见过在SQL查询中传递值有不同的方法,比如?, :1, :varMonth, %s, %(varMonth)s, +varMonth+
,但这些方法似乎不适用于我的代码。尝试时,他们产生了以下错误:PandaSQLException: (sqlite3.ProgrammingError) Incorrect number of bindings supplied. The current statement uses 1, and there are 0 supplied
。我可以将它们放在引号中而不会出错,但随后变量被视为字符串。我将.execute()
{a1}{a2}看作是传递查询变量的一种方式,但是当我将最后一行更改为sqldf.execute(q, [varMonth])
时,我收到了错误AttributeError: 'function' object has no attribute 'execute'
关于如何使用pandasql在JupyterNotebooks上的SQL查询中使用变量,有什么建议吗
看起来pandasql和pysqldf没有像普通数据库一样在查询中使用变量的方法,所以必须使用字符串格式
或f字串
编辑:
我检查了这两个模块的源代码,都使用了pandas.read_sql(),它可以像普通数据库一样获得
params=(...)
,但模块没有使用它如果使用
?
、%s
等,则只会得到错误,因为params
是None
相关问题 更多 >
编程相关推荐