获取标签之间的文本BeautifulSoup4

2024-09-29 06:25:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我试着刮去99点的顶级CS:GO玩家列表,但是我在获取玩家名字时遇到了问题。在

<a href="http://csgo.99damage.de/edb/player/4151-krimz" class="item small">
    <span stype="width:80px;"> 1. </span>
    <span style="width: 280px;">
        <img src="https://cdn1.gamesports.net/img/flags/se.gif" border="0" alt="se" title="Sweden">
        " KRiMZ "
    </span>

“KRiMZ”是我在这个例子中试图得到的球员的名字,但是还有很多其他的名字,所以我不能仅仅搜索KRiMZ。我在网上搜索解决方案,但没有找到解决问题的方法。在


Tags: httpgo列表img玩家decs名字
1条回答
网友
1楼 · 发布于 2024-09-29 06:25:32

我将使用一个CSS selector(基于播放器配置文件URL的player部分)来定位每个player元素,然后在其中定位前两个跨距-第一个是排名,第二个是用户名:

for player in soup.select("#content a[href*="player/"]"):
    rank, name = player.find_all("span")[:2]
    print(rank.get_text(strip=True), name.get_text(strip=True))

下面是我正在执行的完整代码:

^{pr2}$

印刷品:

1. KRiMZ
2. olofmeister
3. JW
4. flusha
5. dennis
6. dev1ce
7. dupreeh
8. Xyp9x
9. Karrigan
10. cajunb
11. friberg
12. GeT_RiGhT
13. f0rest
14. Xizt
15. flamiE
16. GuardiaN
17. seized
18. Edward
19. Zeus
20. kioShiMa
21. pronax
22. Happy
23. NBK

相关问题 更多 >