Python:Slice/transformurl获取项目和项目计数

网友

1楼 · 编辑于 2024-10-01 05:03:32

对于这个问题（信息有限），我建议：

如果您的df如下所示：

df = pd.DataFrame(data={"url": ["http//mysportswebsite.com/shop/?Baseball+Bat=5", "http//memoribilia.com/checkout?autograph=1"]})

                                              url
0  http//mysportswebsite.com/shop/?Baseball+Bat=5
1      http//memoribilia.com/checkout?autograph=1

你可以这样做：

df['product_count_tuple'] = df.url.apply(lambda x: x.split('?')[1].split('='))
df['product'] = df.product_count_tuple.apply(lambda x: x[0].replace('+', ' '))
df['count'] = df.product_count_tuple.apply(lambda x: x[1])
df = df.drop('product_count_tuple', 1)

结果是：

                                              url       product count
0  http//mysportswebsite.com/shop/?Baseball+Bat=5  Baseball Bat     5
1      http//memoribilia.com/checkout?autograph=1     autograph     1

网友

2楼 · 编辑于 2024-10-01 05:03:32

下面是另一种使用re模块的方法：

import re
df['item'] = df['URL'].apply(lambda x: (re.findall('\?(.*)=', x)[0]).replace('+', ' '))
df['count'] = df['URL'].apply(lambda x: int((re.findall('=(.*)', x)[0])))

网友

3楼 · 编辑于 2024-10-01 05:03:32

Python已经有了解析url的库。你知道吗

>>> import urllib.parse as urlparse
>>> url = 'http//mysportswebsite.com/shop/?Baseball+Bat=5'
>>> parsed_url = urlparse.urlparse(url)
>>> params = urlparse.parse_qs(parsed_url.query)
>>> print(params)
{'Baseball Bat': ['5']}

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python:Slice/transformurl获取项目和项目计数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >