Django Import Export：试图在具有unique或unique_together约束的字段中插入重复记录时发生integrityerror

class Compositions(models.Model): composer_key = models.ForeignKey( Composer, ) composition = models.CharField( max_length=383, ) class Meta(object): unique_together = (('composer_key', 'composition'), )

class CompositionsResource(resources.ModelResource): class Meta: model = Compositions skip_unchanged = True report_skipped = True class CompositionsAdmin(ImportExportModelAdmin): resource_class = CompositionsResource admin.site.register(Compositions, CompositionsAdmin)

3条回答

网友
1楼 · 编辑于 2024-09-25 00:32:59

关于已接受答案的一个注释：它将给出所需的结果，但会使磁盘的使用率和时间与大文件一起急剧下降。在
我一直使用的一种更有效的方法（在花了大量时间浏览文档之后）是重写skip_row，并将一组元组作为类的一部分作为唯一约束。我仍然覆盖save_instance，因为另一个答案建议处理通过的integrityerror。在
Pythonsets不创建重复的条目，因此它们似乎适合这种唯一索引。在
class CompositionsResource(resources.ModelResource): set_unique = set() class Meta: model = Composers skip_unchanged = True report_skipped = True def before_import(self, dataset, using_transactions, dry_run, **kwargs): # Clear out anything that may be there from a dry_run, # such as the admin mixin preview self.set_unique = set() def skip_row(self, instance, original): composer_key = instance.composer_key # Could also use composer_key_id composition = instance.composition tuple_unique = (composer_key, composition) if tuple_unique in self.set_unique: return true else: self.set_unique.add(tuple_unique) return super(CompositionsResource, self).skip_row(instance, original) # save_instance override should still go here to pass on IntegrityError
这种方法至少可以减少在同一个数据集中遇到的重复。我用它来处理多个平面文件，每个文件大约60000行，但是有很多重复的/嵌套的外键。这使得初始数据导入速度更快。在

网友
2楼 · 编辑于 2024-09-25 00:32:59

只有一个改变是需要的。你可以用django进出口
模型.py
class Compositions(models.Model): composer_key = models.ForeignKey( Composer, ) composition = models.CharField( max_length=383, unique=False ) date_created = models.DateTimeField(default=timezone.now) class Meta(object): unique_together = (('composer_key','composition'),)
用try重写save_实例。失败时忽略错误。 管理员py
^{pr2}$
把这个导入
from django.db import IntegrityError

网友
3楼 · 编辑于 2024-09-25 00:32:59

在模型.py公司名称：

class Compositions(models.Model):
    composer_key = models.ForeignKey(
        Composer,
        )
    composition = models.CharField(
        max_length=383,
        unique=False
        )
    date_created = models.DateTimeField(default=timezone.now)

    class Meta(object):
        unique_together = (('composer_key','composition'),)

这是我为上述模型编写的“动态”脚本，以便自动丢弃重复的条目。我已经将它保存到./project_name/csv.py，并在用数据填充文件duc.csv的相关列时从shell导入它。列不应包含标题。只有数据。在

^{pr2}$
在csv.py文件公司名称：
from data.models import Composer, Compositions import csv import sys, traceback from django.utils import timezone filename = '/path/to/duc.csv' with open(filename, newline='') as csvfile: all_lines = csv.reader(csvfile, delimiter=',', quotechar='"') for each_line in all_lines: print (each_line) try: instance = Compositions( id=None, date_created=timezone.now(), composer_key=Composer.objects.get(id=each_line[2]), composition=each_line[3] ) instance.save() print ("Saved composition: {0}".format(each_line[3])) except: // exception type must be inserted here exc_type, exc_value, exc_traceback = sys.exc_info() //debugging mostly print (exc_value)

相关问题更多 >

编程相关推荐

热门问题

热门文章