使用Python的LDIF解析器跳过某些属性并写入新的LDIF文件

2024-10-01 04:46:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用python LDIF解析器(link) 编辑某些属性并生成文件的修改版本

我的LDIF文件是

# entry-id: 1
dn: cn=Directory Administrators, dc=organization,dc=corp
nsUniqueId: 2947f1b3-1dd211b2-80b89250-3a51c428
objectClass: top
objectClass: groupofuniquenames
cn: Directory Administrators
creatorsName: cn=directory manager
modifiersName: cn=directory manager
createTimestamp: 20151110180921Z
modifyTimestamp: 20151110180921Z

# entry-id: 2
dn: cn=214-All-Matrix-100342-ALXD,ou=groups,dc=organization,dc=corp
modifyTimestamp: 20190905182416Z
modifiersName: cn=directory manager
owner: uid=hwuebker,ou=people,dc=organization,dc=corp
nsUniqueId: 4350c83d-1dd211b2-80a59250-3a51c428
uniqueMember: uid=anthonys,ou=people,dc=organization,dc=corp
GroupType: Core
Application: AppUID
adminGroupAdmin: cn=IDM System Managers,ou=groups,dc=organization,dc=corp

# entry-id: 3
dn: uid=twalsh,ou=people,dc=organization,dc=corp
nsUniqueId: 3df58701-1dd211b2-80489250-3a51c428
modifyTimestamp: 20180606194655Z
modifiersName: cn=directory manager
initials: 1
Document: 0M8R4KGxGuEAAAAAAAAAAAAAAAAAAAAAPgADAP7/CQAGAAAAAAAAAAAAAAAC
 AAAAAQAAAAAAAAAAEAAAAgAAAAIAAAD+////AAAAAAAAAACAAAAA////////////////////////
 /////////////////////////////////////////////////////////AAAAAA==
Document: RE  E-mail details .msg

我的LDIF解析器的Python代码是

parser = MyLDIF(open(fileName, 'rb'), sys.stdout)
parser.parse()

#LDIF Parser go through records
for dn, entry in parser.parse():
    
        Doc = entry['Document']
        uidList= entry['uid']  
        uid = uidList[0]
        DocValue = Doc[0]
        DocSource = Doc[1]
    
        writer = LDIFWriter(open("data.ldif", "ab"))
        writer.unparse(dn, {
            "nsUniqueId": entry['nsUniqueId'],  
            "Docs": entry['Document'],

        })

作为第一,;第二个条目没有文档属性,这会引发错误

Doc = entry['Document']
  KeyError: 'Document'  

在复制第一个和第二个条目时,如何在不做任何更改的情况下操作第三个条目


Tags: iduiddocmanageroudccndocument
1条回答
网友
1楼 · 发布于 2024-10-01 04:46:47

您可以使用内置方法^{}获取字典中的值,或者如果未设置键,则获取默认值的值

我建议您在类中使用handle方法来实现这一点,并直接写入输出文件(而不是写入stdout并为输出文件创建另一个writer,您仍然可以从handle方法打印数据):

class MyLDIF(LDIFParser):
   def __init__(self, input, output):
      LDIFParser.__init__(self, input)
      self.writer = LDIFWriter(output)

   def handle(self, dn, entry):
      if entry.get('Document', False):
          # modify entry if 'Document' is set
          entry['attribute1'] = 'value1'
          entry['attribute2'] = 'value2'
          # ...
      self.writer.unparse(dn, entry)

parser = MyLDIF(open('data.ldif', 'r'), open('output.ldif', 'w'))
parser.parse()

相关问题 更多 >