靓汤处理错误

2024-10-02 10:28:19 发布

您现在位置:Python中文网/ 问答频道 /正文

  1. 我想知道如何处理href<strong>Text:</strong>之后不存在的情况

  2. 有没有更好的方法来搜索<strong>Contact:</strong>

    之后的内容

http://pastebin.com/FYMxTJkf


Tags: 方法textcomhttp内容情况contactstrong
1条回答
网友
1楼 · 发布于 2024-10-02 10:28:19

findNext怎么样?在

import re
from BeautifulSoup import BeautifulSoup

html = '''<strong>Text:</strong>   

        <a href='http://domain.com'>url</a>'''

soup = BeautifulSoup(html)
label = soup.find("strong" , text='Text:')
contact = label.findNext('a')

if contact.get('href') != None:
    print contact
else:
    print "No href"

如果您要特别查找带有hrefa标记,请使用:

^{pr2}$

这样你就不需要压缩空格了。我想您这样做是因为next在标签后面返回空白。在

相关问题 更多 >

    热门问题