如何从xml文件中提取链接并将其作为文本文件保存在python文件所在的文件夹中

<url> <loc>http://www.something.it/en/new</loc> <changefreq>daily</changefreq> <lastmod>2018-01-21</lastmod> <priority>0.7</priority> </url> from bs4 import BeautifulSoup xml1 = req.get("https://www.something.it/sitemap.xml") content = xml1.text stripped = re.sub('<[^<]+?>', content) print (stripped)

1条回答

网友

1楼 · 发布于 2024-06-26 00:13:52

您可以使用xml(ElementTree)单独提取url：

例如：

import xml.etree.ElementTree as ET

#content = xml1.text    
content = """<url>
<loc>http://www.something.it/en/new</loc>
    <changefreq>daily</changefreq>
        <lastmod>2018-01-21</lastmod>
            <priority>0.7</priority>
</url>"""


xmlContent = ET.fromstring(content)
for content in xmlContent.findall('.//loc'):
    print content.text

结果：

^{pr2}$

编程相关推荐

java为什么程序显示空结果？
java应用程序在测试设备上调试时工作正常，但在发布版apk中没有，它没有获得post。来自firebase的类变量
java Android：从主活动按钮确定在listview中选中哪个复选框
在Spring中添加@OneToOne注释时启动ApplicationContext时发生java错误
用JAVA Android实现矩阵计算的最快方法
SpringJava语义有没有更好的编写方法？
java从hashmap中减去两个值后返回最小差值的键？
Java中的静态初始化顺序：Netty 4.0.7的例外
java如何检查用户输入是否为字符串
循环Java计数单词索引

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从xml文件中提取链接并将其作为文本文件保存在python文件所在的文件夹中

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >