我只是想从这样一个网页上获取一些数据:
[ . . . ]
<p class="special-large">Lorem Ipsum 01</p>
<p class="special-large">Lorem Ipsum 02</p>
<p class="special-large">Lorem Ipsum 03</p>
<p class="special-large">Lorem Ipsum 04</p>
<p class="special-large">Lorem Ipsum 05</p>
[ . . . ]
我想要一个类似以下的python数组:
myArrayWebPage = ["Lorem Ipsum 01","Lorem Ipsum 02","Lorem Ipsum 03","Lorem Ipsum 04","Lorem Ipsum 05"]
这是我的python脚本:
import urllib.request
urlAddress = "http:// ... /" # my url address
getPage = urllib.request.urlopen(urlAddress)
outputPage = getPage.read()
print(outputPage)
如何从“outputPage”获取数组?你知道吗
这似乎是你想要的:
请注意,regular expressions通常不适用于这种情况。您应该改用Beautiful Soup这样的库。你知道吗
相关问题 更多 >
编程相关推荐