用于以下字符串的简单正则表达式

1条回答

网友

1楼 · 发布于 2024-10-01 17:40:18

您正在查看URL引用的数据：

>>> from urllib2 import unquote
>>> unquote('rand_id%3A%3Ftmsid%3D1340496000_EP002960010145_11_0_10050_1_2_10036')
'rand_id:?tmsid=1340496000_EP002960010145_11_0_10050_1_2_10036'

您可以在第一个=上拆分，然后在_上拆分：

>>> unquoted = unquote('rand_id%3A%3Ftmsid%3D1340496000_EP002960010145_11_0_10050_1_2_10036')
>>> unquoted.split('=', 1)[1].split('_')
['1340496000', 'EP002960010145', '11', '0', '10050', '1', '2', '10036']
>>> timestamp, event = unquoted.split('=', 1)[1].split('_')[:2]
>>> timestamp, event
('1340496000', 'EP002960010145')

如果取而代之的是数据有多个字段，并且您在其中也找到了&，那么您也许可以更好地将问号后面的所有内容解析为URL查询字符串，而不是使用^{}

>>> from urlparse import parse_qs
>>> parse_qs(unquoted.split('?', 1)[1])
{'tmsid': ['1340496000_EP002960010145_11_0_10050_1_2_10036']}
>>> parsed = parse_qs(unquoted.split('?', 1)[1])
>>> timestamp, event = parsed['tmsid'][0].split('_', 2)[:2]
>>> timestamp, event
('1340496000', 'EP002960010145')

相关问题更多 >

编程相关推荐

热门问题

热门文章

用于以下字符串的简单正则表达式

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >