如何使用python和selenium从linkedin中的元素中获取所需的文本

2024-09-29 20:18:01 发布

您现在位置:Python中文网/ 问答频道 /正文

下面的“a”元素有两个文本字符串“First Name”和“View First Names's profile”。下面的python代码使用get_text()获得了两个文本字符串。然而,我只想得到第一名,即“名字”。Pl让我知道删除第二个字符串的代码,即“查看名字的个人资料”


all_classes = src.find_all('div', {'class':'mb1'})
for linkClass in all_classes:
    linkClass = linkClass.find_all('a', {'class': 'app-aware-link'})
    for element in linkClass:
        name = element.get_text().strip()
        Name.append(name)

HTML

<a class="app-aware-link" href="https://www.linkedin.com/in/shreyansjain-iitdhn?miniProfileUrn=urn%3Ali%3Afs_miniProfile%3AACoAABpqUi4Bg1wC5QB22-ydCRRB580Zd4gutQ8"> <span dir="ltr"> <span aria-hidden="true"><!-- -->First Name<!-- --></span><span class="visually-hidden"><!-- -->View First Names’s profile<!-- --></span> </span> </a>

html


Tags: 字符串代码textnamein文本viewget
2条回答

要提取Selenium中的名字,我将执行以下操作:

使用下面的CSS_SELECTOR作为名字:

.app-aware-link span[dir='ltr'] span:first-of-type

配置文件名称:

.app-aware-link span[dir='ltr'] span:last-of-type

并按如下方式提取文本:

名字:

for name in  driver.find_elements(By.CSS_SELECTOR, " .app-aware-link span[dir='ltr'] span:first-of-type"):
       print(name.text)

配置文件\u名称:

for profile_name in driver.find_elements(By.CSS_SELECTOR, ".app-aware-link span[dir='ltr'] span:last-of-type"):
       print(profile_name.text)

试试这个:

all_classes = src.find_all('div', {'class':'mb1'})
for linkClass in all_classes:
    linkClass = linkClass.find_all('a', {'class': 'app-aware-link'})
    for element in linkClass:
        if element is not None:
            first_name = element.find_elements_by_xpath('./span/span')[0]       
            if first_name is not None:
                name = first_name.get_text().strip()
                Name.append(name)

相关问题 更多 >

    热门问题