从网页获取姓名和电子邮件

2024-06-28 20:29:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试从Link获取数据。我想从网页中提取姓名/电子邮件/位置等内容并粘贴到网页中。我为它编写了代码,当我运行此代码时,它只存储一个空列表。你知道吗

请帮我从网页上复制这些数据。你知道吗

我想从这个链接获取公司名称、电子邮件、电话号码,并将这些内容放入excel文件中。我想为网站的所有页面做同样的事情。我已经有了在浏览器中获取链接并在它们之间切换的逻辑。我无法从网站上获取数据。谁能给我一个增强我写的代码。你知道吗

下面是我写的代码:

from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.keys import Keys
import time
from lxml import html
import requests
import xlwt

browser = webdriver.Firefox() # Get local session of firefox

# 0 wait until the pages are loaded
browser.implicitly_wait(3) # 3 secs should be enough. if not, increase it

browser.get("http://ae.bizdirlib.com/taxonomy/term/1493") # Load page
links = browser.find_elements_by_css_selector("h2 > a")

#print link
for link in links:
    link.send_keys(Keys.CONTROL + Keys.RETURN)
    link.send_keys(Keys.CONTROL + Keys.PAGE_UP)
#tree = html.fromstring(link.text)
    time.sleep(5)

companyNameElement = browser.find_elements_by_css_selector(".content.clearfix>div>fieldset>div>ul>li").text 
companyName = companyNameElement 
print companyNameElement

下面给出了Html代码

<div class="content">
<div id="node-946273" class="node node-country node-promoted node-full clearfix">
<div class="content clearfix">
<div itemtype="http://schema.org/Corporation" itemscope="">
<fieldset>
<legend>Company Information</legend>
<div style="width:100%;">
<div style="float:right; width:340px; vertical-align:top;">
<br/>
<ul>
<li>
<strong>Company Name</strong>
: 
<span itemprop="name">Sabbro - F.Z.C</span>
</li>
</ul>

当我使用它时,它会给我一个list' object has no attribute 'text'的错误。有人能帮我增强代码并让它工作吗。在这个问题上我有点像是被困了。你知道吗


Tags: 代码textfromimportdivbrowsernode网页
1条回答
网友
1楼 · 发布于 2024-06-28 20:29:32
companyNameElement = browser.find_elements_by_css_selector(".content.clearfix>div>fieldset>div>ul>li").text 
companyName = companyNameElement 
print companyNameElement

查找元素依据。。。返回一个列表,您可以访问该列表的第一个元素,也可以使用等效的find\u element\u by。。。方法只获取第一个元素。你知道吗

相关问题 更多 >