如何选择特定的单词并将它们放入元组列表？

def extract(self): self.url ="http://aetoys.tumblr.com" self.source = requests.get(self.url) self.text = self.source.text self.soup = BeautifulSoup(self.text) for self.div in self.soup.findAll('li',{'class':'has-sub'}): for self.li in self.div.find_all('a'): print(self.li)

1条回答

网友

1楼 · 发布于 2024-10-06 10:27:54

您只需提取href:

out = [] # store lists of lists
for self.div in self.soup.findAll('li',{'class':'has-sub'}):
     out.append([x["href"] for x in self.div.find_all('a',href=True)])
     print([x["href"] for x in self.div.find_all('a',href=True)])



['#', '#', '/onepiece_book', '/onepiece', '#', '/naruto_book', '/naruto', '#', '/bleach_book', '/bleach', '/kingdom', '/tera', '/torico', '/titan', '/seven', '/fairytail', '/soma', '/amsal', '/berserk', '/ghoul', '/kaizi', '/piando']
['#', '/onepiece_book', '/onepiece']
['#', '/naruto_book', '/naruto']
['#', '/bleach_book', '/bleach']
['#', '/conan', '/silver', '/hai', '/nise', '/hunterbyhunter', '/baku', '/unhon', '/souleater', '/liargame', '/kenichi', '/dglayman', '/magi', '/suicide', '/pedal']
['#', '/dobaku', '/gisei', '/dragonball', '/hagaren', '/gantz', '/doctor', '/dunk', '/susi', '/reborn', '/airgear', '/island', '/crows', '/beelzebub', '/zzang', '/akira', '/tennis', '/kuroco', '/claymore', '/deathnote']

要获取单个列表：

url ="http://aetoys.tumblr.com"
source = requests.get(url)
text = source.text
soup = BeautifulSoup(text)

print [ x["href"]  for div in soup.findAll('li',{'class':'has-sub'}) for x in div.find_all('a',href=True)]


['#', '#', '/onepiece_book', '/onepiece', '#', '/naruto_book', '/naruto', '#', '/bleach_book', '/bleach', '/kingdom', '/tera', '/torico', '/titan', '/seven', '/fairytail', '/soma', '/amsal', '/berserk', '/ghoul', '/kaizi', '/piando', '#', '/onepiece_book', '/onepiece', '#', '/naruto_book', '/naruto', '#', '/bleach_book', '/bleach', '#', '/conan', '/silver', '/hai', '/nise', '/hunterbyhunter', '/baku', '/unhon', '/souleater', '/liargame', '/kenichi', '/dglayman', '/magi', '/suicide', '/pedal', '#', '/dobaku', '/gisei', '/dragonball', '/hagaren', '/gantz', '/doctor', '/dunk', '/susi', '/reborn', '/airgear', '/island', '/crows', '/beelzebub', '/zzang', '/akira', '/tennis', '/kuroco', '/claymore', '/deathnote']

如果你真的想要元组：

out = []
for div in soup.findAll('li',{'class':'has-sub'}):
        out.append(tuple(x["href"] for x in div.find_all('a',href=True)))

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何选择特定的单词并将它们放入元组列表？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >