从Html页面获取数据到Python数组中

[ . . . ] Lorem Ipsum 01 Lorem Ipsum 02 Lorem Ipsum 03 Lorem Ipsum 04 Lorem Ipsum 05 [ . . . ]

1条回答

网友

1楼 · 发布于 2024-05-17 00:46:41

这似乎是你想要的：

Python 3.6.0 (v3.6.0:41df79263a11, Dec 23 2016, 08:06:12) [MSC v.1900 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> html = '''<p class="special-large">Lorem Ipsum 01</p>
<p class="special-large">Lorem Ipsum 02</p>
<p class="special-large">Lorem Ipsum 03</p>
<p class="special-large">Lorem Ipsum 04</p>
<p class="special-large">Lorem Ipsum 05</p>'''
>>> import re
>>> re.findall('<p class="special-large">([^<]+)</p>', html)
['Lorem Ipsum 01', 'Lorem Ipsum 02', 'Lorem Ipsum 03', 'Lorem Ipsum 04', 'Lorem Ipsum 05']
>>>

请注意，regular expressions通常不适用于这种情况。您应该改用Beautiful Soup这样的库。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

从Html页面获取数据到Python数组中

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >