我怎么刮这个标签？

2条回答

网友

1楼 · 编辑于 2024-10-02 06:34:01

也许你可以试试正则表达式

import re

text = '<div id="hide-editing-34536258">1/2 and 2/1 are reciprocals.</div>'
parsedText=re.findall('>([^<]+)', text)

print(parsedText[0])

网友

2楼 · 编辑于 2024-10-02 06:34:01

属性是id而不是class，并且您已经给出了在find_all方法中查找的标记。您可以使用regex查找具有特定模式的所有元素

In [61]: import re
In [62]: a = """  <div id="hide-editing-34536258">1/2 and 2/1 are reciprocals.</div>
    ...:    <div id="hide-editing-345258">1/4 and 2/1 are reciprocals.</div>
    ...:   <div id="hide-editing-346258">1/5 and 2/1 are reciprocals.</div>
    ...: """

In [63]: soup = BeautifulSoup(a, "html.parser")

In [64]: all_divs = dates = soup.findAll("div", {"id" : re.compile('hide-editing.*')})

In [65]: all_divs
Out[65]:
[<div id="hide-editing-34536258">1/2 and 2/1 are reciprocals.</div>,
 <div id="hide-editing-345258">1/4 and 2/1 are reciprocals.</div>,
 <div id="hide-editing-346258">1/5 and 2/1 are reciprocals.</div>]

In [66]: [i.text.strip() for i in all_divs]
Out[66]:
['1/2 and 2/1 are reciprocals.',
 '1/4 and 2/1 are reciprocals.',
 '1/5 and 2/1 are reciprocals.']

相关问题更多 >

编程相关推荐

热门问题

热门文章

我怎么刮这个标签？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >