使用python selenium提取文本

2024-09-19 23:43:32 发布

您现在位置:Python中文网/ 问答频道 /正文

谢谢你过来。从中提取usersessionid时遇到问题。我正在使用python seleium。我欢迎每一个asnwer。 这是网页的网址

http://www.barneys.com/product/etq-amsterdam--22low-3-22-leather--26-jacquard-sneakers-504720152.html

`<script charset="utf-8" type="text/javascript">

        var apiKey= "dbeab3c977a08905",
            clientApiKey = "8ed86f73d8296e2c",
            environment="recs",
            userSessionID= "N5pPRdoSPKl1D7LjwRyqiemXrMy6JWbn65PjU7XsMgQC68XuZsCl!778638265!763427-prodapp2!20580!-1!1474503760402",
            userID= "73558799",
            rrDown = false,
            rrFlag = true;

        var richRelevance = {

            init: function(){
                try{
                    if(typeof r3_common === 'function'){
                        window.R3_COMMON = new r3_common();

Tags: comhttp网页varwwwfunctioncommonproduct
1条回答
网友
1楼 · 发布于 2024-09-19 23:43:32

在这种情况下,可以使用正则表达式提取它:

import re

from selenium import webdriver


driver = webdriver.Chrome()
driver.get("http://www.barneys.com/product/etq-amsterdam 22low-3-22-leather 26-jacquard-sneakers-504720152.html")

print(re.search(r'userSessionID\s*=\s*"(.*?)",', driver.page_source).group(1))

打印p2tPvuezfq3hjHKxe8kIA5JU7b0wRt4dy8Y-L7Bm8PvKv17DiH8X!-603204638!763426-prodapp1!20680!-1!1474511693747

相关问题 更多 >