比如说,我有一根绳子
s = '\r\n<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> \r\n\r\n<p>\r\n\t\r\n\t\t<A HREF="../temp/Table 32012419252223.xls">Click to download</A>\r\n\r\n\t\r\n\t</P>'
我只需要从上面的字符串中获取/temp/Table 32012419252223.xls
。你知道吗
其次,我有一个链接,例如
link = "www.example.com/flow/hardway/joshing/high"
现在我需要用第一个链接(/temp/Table 32012419252223.xls
)的结果替换上面链接中的"joshing/high"
。你知道吗
如果要解析HTML或XML文档,请使用适当的库。使用lxml和xpath的示例如下:
获取页面上的第一个链接。如果HTML更复杂,还可以使用更复杂的XPath表达式。你知道吗
相关问题 更多 >
编程相关推荐