我目前正在编写一个python脚本,可以提取xml文件中的所有文本。我正在使用元素树库来解释数据,但是我遇到了这个问题,但是当数据是这样构造的
<Segment StartTime="639.752" EndTime="642.270" Participant="fe016">
But I bet it's a good <Pause/> superset of it.
</Segment>
当我试着读课文时,我会在暂停标记之前看到段的前半部分(“好的,我们所看到的”)
我想弄清楚的是,是否有一种方法可以忽略数据段中的标记并打印出所有文本
Tags:
另一个解决方案
结果:
这里有更多的例子https://github.com/yiyedata/simplified-scrapy-demo/blob/master/doc_examples
相关问题 更多 >
编程相关推荐