如何提高Django mysql的拷贝性能？

res = sourcedb.fetchall() # from Appointment Table for myrecord in res: try: existingrecord = Person.objects.filter(vendorid = myrecord[12], office = myoffice)[0] except: existingrecord = Person(vendorid = myrecord[12], office = myoffice) existingrecord.firstname = myrecord[0] existingrecord.midname = myrecord[1] existingrecord.lastname = myrecord[2] existingrecord.address1 = myrecord[3] existingrecord.address2 = myrecord[4] existingrecord.save()

1条回答

网友

1楼 · 发布于 2024-09-27 21:26:41

一些想法：

编辑：查看Trewq对此的评论，首先在表上创建索引
使用with transaction.atomic():将其全部打包到事务中，因为默认情况下，Django将为每个save()调用创建一个新的事务，这可能会变得非常昂贵。对于20K条记录，一个巨大的事务也可能是个问题，因此您可能需要编写一些代码来将事务拆分为多个批处理。试试看！你知道吗
如果RAM不是一个问题（不应该是一个有20k条记录的问题），那么首先从appointment表中获取所有数据，然后使用单个SELECT查询而不是每个记录获取所有现有的Person对象
使用bulk_create，即使其中一些是更新。这仍然会为您的更新发出UPDATE查询，但是会将所有INSERT查询减少到只有一个/几个，这仍然是一个改进。您可以通过插入在调用save()之前不设置主键的事实来区分插入和更新，并将插入保存到Python列表中以备以后bulk_create使用，而不是直接保存它们
最后一种方法：编写原始SQL以使用MySQLsINSERT … ON DUPLICATE KEY UPDATE语法。您不需要相同的主键，一个UNIQUE键就足够了。键可以跨越多个列，请参见Django的Meta.unique_together模型选项。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何提高Django mysql的拷贝性能？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >