仅提取链接和标题

import requests from bs4 import BeautifulSoup r = requests.get('http://animeonline.vip/info/phi-brain-kami-puzzle-3') soup = BeautifulSoup(r.content, "html.parser") for link in soup.find_all('div', class_='list_episode'): href = link.get('href') print(href)

<a href="http://animeonline.vip/phi-brain-kami-puzzle-3-episode-25" title="Phi Brain: Kami no Puzzle 3 episode 25"> Phi Brain: Kami no Puzzle 3 episode 25 <span> 26-03-2014</span> </a>

2条回答

网友

1楼 · 编辑于 2024-09-30 06:27:26

所以现在的情况是，link元素在anchor<div>和class=“last\u epoince”中包含了所有的信息，但是其中有很多锚，在“href”中包含链接，在“title”中包含标题。你知道吗

只要修改一下代码，你就会得到你想要的。你知道吗

import requests
from bs4 import BeautifulSoup

r = requests.get('http://animeonline.vip/info/phi-brain-kami-puzzle-3')
soup = BeautifulSoup(r.content, "html.parser")
for link in soup.find_all('div', class_='list_episode'):
    href_and_title = [(a.get("href"), a.get("title")) for a in link.find_all("a")]   
    print href_and_title

输出形式为[（href，title），（href，title），………（href，title）]

编辑（说明）：

所以当你这么做的时候

soup.find_all('div', class_='list_episode')

它用“div”和class“last\u epoince”提供了所有细节（在html页面中），但是现在这个锚点包含了大量锚点，这些锚点具有不同的“href”和标题细节，因此我们使用for循环（可以有多个锚点（<a>））和“.get（）”。你知道吗

 href_and_title = [(a.get("href"), a.get("title")) for a in link.find_all("a")]

我希望这次更清楚。你知道吗

网友

2楼 · 编辑于 2024-09-30 06:27:26

整个页面只有一个类为“list\u”的元素，因此您可以过滤掉“a”标记，然后获取属性“href”的值：

In [127]: import requests
     ...: from bs4 import BeautifulSoup
     ...: 
     ...: r = requests.get('http://animeonline.vip/info/phi-brain-kami-puzzle-3')
     ...: soup = BeautifulSoup(r.content, "html.parser")
     ...: 

In [128]: [x.get('href') for x in soup.find('div', class_='list_episode').find_all('a')]
Out[128]: 
[u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-25',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-24',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-23',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-22',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-21',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-20',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-19',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-18',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-17',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-16',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-15',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-14',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-13',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-12',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-11',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-10',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-9',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-8',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-7',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-6',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-5',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-4',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-3',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-2',
 u'http://animeonline.vip/phi-brain-kami-puzzle-3-episode-1']

相关问题更多 >

编程相关推荐

热门问题

热门文章