使用正则表达式分析URL

3条回答

网友

1楼 · 编辑于 2024-06-23 03:14:44

>>> import urlparse
>>> parse_result = urlparse.urlparse('https://www.searchpage.com/searchcompany.aspx?
companyId=41490234&page=0&leftlink=true')

>>> parse_result
ParseResult(scheme='https', netloc='www.searchpage.com', 
path='/searchcompany.aspx', params='', 
query='companyId=41490234&page=0&leftlink=true', fragment='')

>>> urlparse.parse_qs(parse_result.query)
{'leftlink': ['true'], 'page': ['0'], 'companyId': ['41490234']}

最后一行是键/值对的字典。在

网友

2楼 · 编辑于 2024-06-23 03:14:44

此正则表达式：

(^[^?]*$|(?<=\?).*)

捕获：

^[^?]*$所有内容，如果没有?，或者
(?<=\?).*在?之后的所有内容（如果有）

但是，如果您使用的是url，则应该研究^{}（python3）或{a2}（python2）。在

网友

3楼 · 编辑于 2024-06-23 03:14:44

regex可能不是解决这个问题的最佳解决方案…为什么不只是

my_url.split("?",1)

如果这真的是你想要做的

或者像其他人建议的那样

from urlparse import urlparse
print urlparse(my_url)

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用正则表达式分析URL

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >