作为开发工具的一部分，我只需要提取flipkart.com或flipkarthttp://www.flipkart.com

2条回答

网友

1楼 · 编辑于 2024-09-28 21:30:15

使用标准库模块^{}：

In [72]: from urlparse import urlparse

In [73]: flipkart = urlparse("http://www.flipkart.com/lenovo-a6000/p/itme3763q9phgbpn?q=Lenovo A6000&as=on&as- show=on&otracker=start&as-pos=p_1_lenovo&pid=MOBE3762KWZZYZHZ")

In [74]: flipkart.netloc
Out[74]: 'www.flipkart.com'

In [75]: flipkart
Out[75]: ParseResult(scheme='http', netloc='www.flipkart.com', path='/lenovo-a6000/p/itme3763q9phgbpn', params='', query='q=Lenovo A6000&as=on&as- show=on&otracker=start&as-pos=p_1_lenovo&pid=MOBE3762KWZZYZHZ', fragment='')

这将返回一个由6个组件组成的元组；对应于URL的一般结构：scheme://netloc/path;parameters?query#fragment

网友

2楼 · 编辑于 2024-09-28 21:30:15

tld包将帮助您：

from tld import get_tld
from tld.utils import update_tld_names
update_tld_names()

print get_tld("http://www.flipkart.com")

输出

flipkart.com

编程相关推荐

http POST请求Java CouchDB
java删除带有大量尾随0的浮点字符串上的科学符号
JavaEE5和Hibernate
java如何在Spring Social中获得比特定id更早的tweet
java是框架。revalidate（）在事件后获取输出是否重要？
java为什么不能返回通用映射？
java如何理解和优化工厂方法的高自时间
java Eclipse 202006错误由于项目的生成路径不完整，因此未生成该项目
多线程是java。util。向量序列化线程安全？
在Eclipse和java中使用不同的构建配置。属性文件

相关问题更多 >

编程相关推荐

热门问题

热门文章

作为开发工具的一部分，我只需要提取flipkart.com或flipkarthttp://www.flipkart.com

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >