使用scrapyd提取json

2024-10-04 07:33:45 发布

您现在位置:Python中文网/ 问答频道 /正文

如何提取架构.org仅来自此网页代码?它是json格式的,给了我很多时间。我只需要能给我答案的信息架构.org链接。当我爬行时,我想抽出架构.org从每个网站,并把它放在一个文件中。你知道吗

<script type="application/ld+json">
{
    "@context": "http://schema.org",
    "@type": "Product",
    "name": "Scutece Huggies Ultra Confort BOX 5, Girl, 12-22 kg, 105 buc",
        "url":"http://www.emag.ro/scutece-huggies-ultra-confort-box-5-girl-12-22-kg-105-buc-5029053546919/pd/DPS0Q7BBM/",
    "sku":"DPS0Q7BBM",
    "brand": {
        "@type": "Brand",
        "name": "Huggies"
    },
    "offers": {
        "@type": "Offer",
        "seller": "eMAG",
        "availability": "http://schema.org/InStock",
    },
    }
</script>

更新:

已经尝试了:

导入json

jsonresponse=json.loads文件(response.body作为unicode())

告诉我:没有JSON对象可以被解码


Tags: 文件代码nameorgjsonhttp网页架构