下面的“a”元素有两个文本字符串“First Name”和“View First Names's profile”。下面的python代码使用get_text()获得了两个文本字符串。然而,我只想得到第一名,即“名字”。Pl让我知道删除第二个字符串的代码,即“查看名字的个人资料”
all_classes = src.find_all('div', {'class':'mb1'})
for linkClass in all_classes:
linkClass = linkClass.find_all('a', {'class': 'app-aware-link'})
for element in linkClass:
name = element.get_text().strip()
Name.append(name)
HTML
<a class="app-aware-link" href="https://www.linkedin.com/in/shreyansjain-iitdhn?miniProfileUrn=urn%3Ali%3Afs_miniProfile%3AACoAABpqUi4Bg1wC5QB22-ydCRRB580Zd4gutQ8">
<span dir="ltr">
<span aria-hidden="true"><!-- -->First Name<!-- --></span><span class="visually-hidden"><!-- -->View First Names’s profile<!-- --></span>
</span>
</a>
要提取Selenium中的名字,我将执行以下操作:
使用下面的
CSS_SELECTOR
作为名字:配置文件名称:
并按如下方式提取文本:
名字:
配置文件\u名称:
试试这个:
相关问题 更多 >
编程相关推荐