我需要用Python(beautifulsoup或scrapy)解析HTML文件中的信息,然后将其打印到csv文件中。相关信息是文件名和在我的帐户here中看到的次数
有关次数的相关HTML:
<div class="hidden-tiles views C C1">
<nobr class="hidden-xs">num </nobr>
<nobr class="hidden-sm hidden-md hidden-lg">num</nobr>
</div>
文件名的相关HTML:
<div class="ttl">
{filename}
</div>
我能做的是:
import requests
page = requests.get("https://archive.org/details /%40kareem76?&sort=-publicdate&page=2")
page
page.content
nbr = BeautifulSoup(page.content, 'html.parser')
nbr.find_all('div', class_='hidden-tiles views C C1')
也许这是另一个解决方案
结果:
此代码应执行以下操作:
你会得到(只是摘录):
相关问题 更多 >
编程相关推荐