我想做的是:
创建GET请求以加载HTML源代码
搜索源以查找字符串,如果找到字符串,则将整行提取到变量中
我到处都在寻找如何做到这一点,但人们只解释如何提取整个源代码或使用字典。你知道吗
例如,使用WWE页面:
我想提取包含这个字符串的行
http://thumbs.media.net.wwe.com/wwe/
代码:
def extract(url):
html = requests.get(url)
text = html.text
word = None
for line in text:
if 'http://thumbs.media.net.wwe.com/wwe/' in line:
word = line
return word
当我执行该功能时,程序将返回None作为第一个指定值。你知道吗
注意我只需要第一个匹配项,而不是变量中的其他所有匹配项
这应该起作用:
或者,更短:
或者使用regex更好:
相关问题 更多 >
编程相关推荐