如何使用python截断url

2024-10-01 09:22:41 发布

您现在位置:Python中文网/ 问答频道 /正文

如何使用python截短域“com”旁边的以下URL。i、 你呢tube.com公司只有

    youtube.com/video/AiL6nL
    yahoo.com/video/Hhj9B2
    youtube.com/video/MpVHQ
    google.com/video/PGuTN
    youtube.com/video/VU34MI

可以这样截短吗?


Tags: comurlyoutubevideogoogle公司yahootube
3条回答

我将使用标准库中的函数^{}

from urlparse import urlsplit # python 2
from urllib.parse import urlsplit # python 3

myurl = "http://docs.python.org/2/library/urlparse.html"
urlsplit(myurl)[1] # returns 'docs.python.org'

可以使用split():

myUrl.split(r"/")[0]

为了得到“youtube.com网站““

以及:

^{pr2}$

为了得到其他一切

查看Python^{}库。它是一个标准库,所以不需要安装其他任何东西。在

因此您可以执行以下操作:

import urlparse
import re

def check_and_add_http(url):
    # checks if 'http://' is present at the start of the URL and adds it if not.
    http_regex = re.compile(r'^http[s]?://')
    if http_regex.match(url):
        # 'http://' or 'https://' is present
        return url
    else:
        # add 'http://' for urlparse to work.
        return 'http://' + url

for url in url_list:
    url = check_and_add_http(url)
    print(urlparse.urlsplit(url)[1])

您可以在文档中阅读更多关于^{}的内容,如果您想阅读URL的其他部分,可以包括索引。在

相关问题 更多 >