2024-09-18 16:44:57 发布
网友
url1='www.google.com' url2='http://www.google.com' url3='http://google.com' url4='www.google' url5='http://www.google.com/images' url6='https://www.youtube.com/watch?v=6RB89BOxaYY
如何在Python中从url中剥离http(s)和www?
http(s)
www
可以使用regex,这取决于数据的严格程度。http和www会一直存在吗?你想过https或w3网站吗?
import re new_url = re.sub('.*w\.', '', url, 1)
1不伤害以w结尾的网站
澄清后编辑
我要做两个步骤:
if url.startswith('http'): url = re.sub(r'https?:\\', '', url) if url.startswith('www.'): url = re.sub(r'www.', '', url)
您可以使用regex
regex
url = 'http://www.google.com/images' url = url.replace("http://www.","") print url
或者您可以使用regular expressions
regular expressions
import re url = re.compile(r"https?://(www\.)?") url.sub('', 'http://www.google.com/images').strip().strip('/')
可以使用regex,这取决于数据的严格程度。http和www会一直存在吗?你想过https或w3网站吗?
1不伤害以w结尾的网站
澄清后编辑
我要做两个步骤:
您可以使用
regex
或者您可以使用
regular expressions
相关问题 更多 >
编程相关推荐