Python SAX部分

<testcase internalid="1256092" name="hls_vtt_single_default_diable_vtt"> <node_order><![CDATA[7]]></node_order> <externalid><![CDATA[6121]]></externalid> <version><![CDATA[2]]></version> <summary><![CDATA[<p>condition: single subtitle track is available in stream and it is default  set the vtt track to diable status before playing stream.</p> <p> </p> <div>play stream no subtitle is rendered along with A/V<span class="Apple-tab-span" style="white-space:pre"> </span></div> <div> </div>]]></summary> <preconditions><![CDATA[]]></preconditions> <execution_type><![CDATA[1]]></execution_type> <importance><![CDATA[2]]></importance> </testcase>

1条回答

网友

1楼 · 发布于 2024-09-29 02:27:45

如answer所示，您应该将解析后的值+=content与每个对characters()的调用连接起来。但是，要删除解析的CDATA中的xml内容（包括换行符和空格），请考虑使用regex替换：

import xml.sax
import re

class CaseHandler( xml.sax.ContentHandler ):
   def __init__(self):
      self.CurrentData = ""
      self.externalid = ""
      self.version = ""
      self.summary = ""

   def startElement(self, tag, attributes):
       self.CurrentData = tag
       if tag == "testcase":
           name = attributes["name"]
           outfile.write("\r" + name + " ,")

   def endElement(self, tag):
       if self.CurrentData == "externalid":
           outfile.write("OTV52-" + self.externalid + ",")

       elif self.CurrentData == "version":        
           outfile.write("Version:  " + self.version + ",")

       elif self.CurrentData == "summary":
           self.summary = re.sub("<[^>]+>", "", self.summary)
           self.summary = re.sub("\n|&nbsp;|/\s\s/", "", self.summary).strip()
           outfile.write("Summary:  " + self.summary + ",")

   def characters(self, content):
      if self.CurrentData == "externalid":
         self.externalid += content
      elif self.CurrentData == "version":
         self.version += content
      elif self.CurrentData == "summary":
         self.summary += content

输出（所有一行）

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章