从pyodbc到MS-SQL的编码调用

for sqlalchemy import * def connect(): return pyodbc.connect('DSN=database;UID=uid;PWD=password') engine = create_engine('mssql://', creator=connect, encoding='latin1') connection = engine.connect()

3条回答

网友

1楼 · 编辑于 2024-09-27 21:34:24

尝试使用pyodbc.connect()参数convert_unicode=True连接到数据库，例如从sqlalchemy：

engine = create_engine('mssql://yourdb', connect_args={'convert_unicode': True})

这应该确保您得到的所有结果（而不仅仅是来自nvarchar等的结果）都是unicode，正确地从数据库中使用的任何编码转换而来。

至于写入数据库，请始终使用unicode。如果我没有弄错（稍后会检查），pyodbc将确保它也能正确地写入数据库。

（当然，如果数据库使用的编码不支持要写入的字符，则仍然会出现错误：如果希望列支持任何类型的字符，则还必须在数据库上使用unicode列）

网友

2楼 · 编辑于 2024-09-27 21:34:24

您应该停止使用代码页并切换到Unicode。这是解决这类问题的唯一方法。

网友

3楼 · 编辑于 2024-09-27 21:34:24

原始评论变成了答案：

cp1250和cp1252不是“拉丁编码”。排序规则不是编码。回复：谁说“服务器是用拉丁语编码的”？如果服务器希望所有输入/输出都用拉丁语1编码（我对此表示怀疑），那么您就很难将一些东欧字符输入到数据库中（俄语、汉语、希腊语等）。

更新：

你需要看得比校勘更远些msdn.microsoft.com/en-us/library/ms174596（v=SQL.90）。aspx建议，对于Latin1_-General_-CI_，因为使用的编码是cp1252“”，所以是codswallop。该表为每个区域设置提供一个LCID（区域设置ID）、默认值排序规则和代码页。是的，排序规则“Latin1_General_CI_AS”与多个地区的cp1252代码页关联列出。对于两个地区（亚美尼亚语和格鲁吉亚语），它与“Unicode”代码页（！！！）关联列出。

很简单，您需要了解数据库使用的代码页是什么。

尝试从数据库中提取数据而不指定任何编码。不要费心编码，不管你猜你的控制台可能在使用什么编码——这只会增加另一个混乱的来源。相反，使用print repr(data)。在这里报告您从repr（）中获得的信息，在这里您需要非拉丁字符。

相关问题更多 >

编程相关推荐

热门问题

热门文章