我无法使用python正确循环遍历xml文件，如何循环遍历并以正确的顺序返回多个不同的标记？

<?xml version="1.0" encoding="UTF-8" standalone="no"?> <FileDump> <Version>1.3</Version> <Conversation> <RoomID>1</RoomID> <StartTime>09/09/2021 19:35:35</StartTime> <StartTimeUTC>1631216135</StartTimeUTC> <ParticipantEntered> <User> <LoginName>JJohnson</LoginName> <FirstName>John</FirstName> <LastName>Johnson</LastName> <CompanyName>ABC LimitedCO</CompanyName> <EmailAddress>JJ@ABC.com</EmailAddress> <CorporateEmailAddress>none</CorporateEmailAddress> <Content> good Morning how are you today? </Content> </User> <DateTime>09/09/2021 19:35:35</DateTime> <DateTimeUTC>1631216135</DateTimeUTC> <ConversationID></ConversationID> </ParticipantEntered> <Message> <User> <LoginName>MMArks</LoginName> <FirstName>Mark</FirstName> <LastName>Marks</LastName> <CompanyName>XYZ Corp</CompanyName> <EmailAddress>mm@xyz.com</EmailAddress> <CorporateEmailAddress></CorporateEmailAddress> <Content> what time is it? </Content> </User> </Message> </Conversation> </FileDump>

import xml.etree.ElementTree as ET mytree = ET.parse(r'sample.xml') myroot = mytree.getroot() for content in myroot.iter('Content'): for name in myroot.iter('CompanyName'): cname = name output = content print(name.text, output.text)

for content in myroot.findall('Conversation'): output = content.find('Content') FName = content.find('FirstName') LName = content.find('LastName') cont = content.find('CompanyName') print(cont, "\n", FName, LName, output)

for content in myroot.findall('Conversation'): output = content.find('Content').text FName = content.find('FirstName').text LName = content.find('LastName').text cont = content.find('CompanyName').text print(cont, "\n", FName, LName, output)

<?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank>1</rank> <year>2008</year> <gdppc>141100</gdppc> <neighbor name="Austria" direction="E"/> <neighbor name="Switzerland" direction="W"/> <FirstName>John</FirstName> <LastName>Johnson</LastName> <CompanyName>ABC LIMITED</CompanyName> <Content> Good Morning How are you? </Content> </country> <country name="Singapore"> <rank>4</rank> <year>2011</year> <gdppc>59900</gdppc> <neighbor name="Malaysia" direction="N"/> <FirstName>Mark</FirstName> <LastName>Marks</LastName> <CompanyName>XYZ Corp</CompanyName> <Content> Good Morning </Content> </country> <country name="Panama"> <rank>68</rank> <year>2011</year> <gdppc>13600</gdppc> <neighbor name="Costa Rica" direction="W"/> <neighbor name="Colombia" direction="E"/> <FirstName>Keith</FirstName> <LastName>Keitherson</LastName> <CompanyName>WW Corp</CompanyName> <Content> Good Evening </Content> </country> </data>

for content in myroot.findall('.//Conversation'): output = content.find('.//Content').text FName = content.find('.//FirstName').text LName = content.find('.//LastName').text cont = content.find('.//CompanyName').text print(cont, "\n", FName, LName, output)

<?xml version="1.0" encoding="UTF-8"?> <FileDump> <Version>1.3</Version> <Conversation> <RoomID>CHAT</RoomID> <StartTime>09/09/2021 19:35:35</StartTime> <StartTimeUTC>1631216135</StartTimeUTC> <ParticipantEntered InteractionType="N" DeviceType="M"> <User> <LoginName>JJohnson</LoginName> <FirstName>JOHN</FirstName> <LastName>Johnson</LastName> <CompanyName>ABC Limited CO</CompanyName> <EmailAddress>JJ@abc.com</EmailAddress> <CorporateEmailAddress></CorporateEmailAddress> </User> <DateTime>09/09/2021 19:35:35</DateTime> <DateTimeUTC>1631216135</DateTimeUTC> <Content> Testing Content 1 </Content> <ConversationID>CHAT</ConversationID> </ParticipantEntered> <Message> <User> <LoginName>MMarks</LoginName> <FirstName>Mark</FirstName> <LastName>MArks</LastName> <CompanyName>XYZ Corp</CompanyName> <EmailAddress></EmailAddress> <CorporateEmailAddress></CorporateEmailAddress> </User> <DateTime>09/09/2021 19:35:35</DateTime> <DateTimeUTC>1631216135</DateTimeUTC> <Content> Testing content 2 </Content> <ConversationID>CHAT</ConversationID> </Message> <ParticipantEntered> <User> <LoginName>SSamson</LoginName> <FirstName>Sam</FirstName> <LastName>Samson</LastName> <CompanyName>123 CorpCO</CompanyName> <EmailAddress></EmailAddress> <CorporateEmailAddress></CorporateEmailAddress> <Content> Testing content 3 </Content> </User> </ParticipantEntered> </Conversation> </FileDump>

1条回答

网友

1楼 · 发布于 2024-09-30 04:39:13

看起来下面这张照片就是你要找的

import xml.etree.ElementTree as ET

xml = '''<?xml version="1.0" encoding="UTF-8"?>
<FileDump>
   <Version>1.3</Version>
   <Conversation>
      <RoomID>CHAT</RoomID>
      <StartTime>09/09/2021 19:35:35</StartTime>
      <StartTimeUTC>1631216135</StartTimeUTC>
      <ParticipantEntered InteractionType="N" DeviceType="M">
         <User>
            <LoginName>JJohnson</LoginName>
            <FirstName>JOHN</FirstName>
            <LastName>Johnson</LastName>
            <CompanyName>ABC Limited CO</CompanyName>
            <EmailAddress>JJ@abc.com</EmailAddress>
            <CorporateEmailAddress />
         </User>
         <DateTime>09/09/2021 19:35:35</DateTime>
         <DateTimeUTC>1631216135</DateTimeUTC>
         <Content>Testing Content 1</Content>
         <ConversationID>CHAT</ConversationID>
      </ParticipantEntered>
      <Message>
         <User>
            <LoginName>MMarks</LoginName>
            <FirstName>Mark</FirstName>
            <LastName>MArks</LastName>
            <CompanyName>XYZ Corp</CompanyName>
            <EmailAddress />
            <CorporateEmailAddress />
         </User>
         <DateTime>09/09/2021 19:35:35</DateTime>
         <DateTimeUTC>1631216135</DateTimeUTC>
         <Content>Testing content 2</Content>
         <ConversationID>CHAT</ConversationID>
      </Message>
      <ParticipantEntered>
         <User>
            <LoginName>SSamson</LoginName>
            <FirstName>Sam</FirstName>
            <LastName>Samson</LastName>
            <CompanyName>123 CorpCO</CompanyName>
            <EmailAddress />
            <CorporateEmailAddress />
            <Content>Testing content 3</Content>
         </User>
      </ParticipantEntered>
   </Conversation>
</FileDump>
'''

NOT_FOUND = '__NOT_FOUND__'


def _get(ele, name):
    sub = ele.find(name)
    return sub.text if sub is not None else NOT_FOUND


root = ET.fromstring(xml)
elements = ['CompanyName', 'LoginName', 'FirstName', 'Content']


def loop(base_ele):
    for pe in root.findall(f'.//{base_ele}'):
        content = _get(pe, 'Content')
        u = pe.find('User')
        data = [_get(u, x) for x in elements] if content == NOT_FOUND else [_get(u, x) for x in elements[:-1]]
        if len(data) < 4:
            data.append(content)
        msg = ' '.join(data)
        print(f"{msg}")


loop('ParticipantEntered')
loop('Message')

输出

ABC Limited CO JJohnson JOHN Testing Content 1
123 CorpCO SSamson Sam Testing content 3
XYZ Corp MMarks Mark Testing content 2

相关问题更多 >

编程相关推荐

热门问题

热门文章