如何从字符串中获取所需的数据

2024-10-01 07:40:20 发布

男 | 程序猿一只，喜欢编程写python代码。

比如说，我有一根绳子

s = '\r\n<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> \r\n\r\n<p>\r\n\t\r\n\t\t<A HREF="../temp/Table 32012419252223.xls">Click to download</A>\r\n\r\n\t\r\n\t</P>'

我只需要从上面的字符串中获取/temp/Table 32012419252223.xls。你知道吗

其次，我有一个链接，例如

link = "www.example.com/flow/hardway/joshing/high"

现在我需要用第一个链接（/temp/Table 32012419252223.xls）的结果替换上面链接中的"joshing/high"。你知道吗

Tags：链接 html table public w3c xls temp doctype

1条回答

网友

1楼 · 发布于 2024-10-01 07:40:20

如果要解析HTML或XML文档，请使用适当的库。使用lxml和xpath的示例如下：

from lxml.html.soupparser import fromstring
from urlparse import urljoin

s = 'yourhtml'
h = fromstring(s)
print urljoin(link, h.xpath('//a[1]/@href')[0]))

获取页面上的第一个链接。如果HTML更复杂，还可以使用更复杂的XPath表达式。你知道吗

如何从字符串中获取所需的数据

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从字符串中获取所需的数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >