如何从下面的html脚本中获取信息？

2条回答

网友

1楼 · 编辑于 2024-09-27 23:26:06

您可以使用regex获取json并进行解析：

import json
import re

data = json.loads(re.search(r"dataLayer =(.*);", d, re.DOTALL).group(1))
products = data[0]["ecommerce"]["detail"]["products"]
product_name = products[0]["name"]
product_id = products[0]["id"]
product_price = products[0]["price"]
product_brand = products[0]["brand"]
product_category = products[0]["category"]

网友

2楼 · 编辑于 2024-09-27 23:26:06

这是一个临时解决方案，取决于接收到更多关于数据格式的信息。你知道吗

import re
import json

def get_datalayer_json(raw_script_tag: str):
    parser_re = r"<script>\s*dataLayer =(.*);\s*</script>"
    parser_result = re.match(parser_re, raw_script_tag.strip(), re.DOTALL)
    if parser_result is None:
        return None
    else:
        return json.loads(parser_result.group(1))

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从下面的html脚本中获取信息？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >