如何使用BeautifulSoup中应用的regex从<p>标记获取文本?

2024-10-02 06:39:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我用python编写了一些脚本,使用regex从某些p标签中获取文本,但是这个脚本给了我一个空列表。在

这是html elements的磁性部分:

   <div class="result__links">
        <p class="result__outcome u-hide-phablet">Kolkata Knight Riders won by 7 wickets</p>
        <p class="result__info u-hide-phablet">
            Match 15, 20:00 IST (14:30 GMT), Sawai Mansingh Stadium, Jaipur
        </p>
        <a class="result__button result__button--mc btn" href="/match/2018/15?tab=scorecard">Match Centre</a>
    </div>

如何获取包装在下面类中的p标记的文本?在

^{pr2}$

其目的是使用regex获取上述标记的文本。在

到目前为止,我已经尝试过:

^{3}$

以上部分生成空列表。如果有任何帮助,我们将不胜感激。在

后记:我正在寻找与regex相关的任何解决方案。在


Tags: 标记文本div脚本列表htmlmatchbutton
1条回答
网友
1楼 · 发布于 2024-10-02 06:39:12

要访问感兴趣的标记,可以执行以下操作:

for p in soup.findAll("p", {"class" : "result__outcome u-hide-phablet"}):
    tags_text = p.text

对于跨度,您需要以同样的方式:

^{pr2}$

这是为了得到每个标签中的文本,正如你在问题中所问的那样。在

相关问题 更多 >

    热门问题