TypeError:“NoneType”对象不可订阅，webscrapin Python

from urllib.request import urlopen import urllib from bs4 import BeautifulSoup import requests import pprint def infopelicula(nombrepelicula): my_url='http://www.imdb.com/find?ref_=nv_sr_fn&q='+nombrepelicula+'&s=tt' rprincipal = requests.get(my_url) soup= BeautifulSoup(rprincipal.content, 'html.parser') title = soup.findAll("td", class_="result_text") for name in title: titulo = name.parent.find("a", href=True) print (name.text)[0]

2条回答

网友

1楼 · 编辑于 2024-10-01 11:34:47

在Python3.5中，print是一个返回{}的函数，这个函数（错误清楚地说）不能下标。在

也许你是说print(name.text[0])？在

网友

2楼 · 编辑于 2024-10-01 11:34:47

这个怎么样：

import requests
from bs4 import BeautifulSoup

def infopelicula():
    my_url = 'http://www.imdb.com/find?ref_=nv_sr_fn&q="Harry Potter Chamber"&s=tt'
    soup = BeautifulSoup(requests.get(my_url).text, 'lxml')
    for name in soup.find_all("td",class_="result_text"):
        title = name.find_all("a",text=True)[0]
        print (title.text)
infopelicula()

部分输出：

^{pr2}$

仅第一个标题：

import requests
from bs4 import BeautifulSoup

def infopelicula():
    my_url = 'http://www.imdb.com/find?ref_=nv_sr_fn&q="Harry Potter Chamber"&s=tt'
    soup = BeautifulSoup(requests.get(my_url).text, 'lxml')
    for name in soup.find_all("td",class_="result_text")[:1]:
        title = name.find_all("a",text=True)[0]
        print (title.text)
infopelicula()

输出：

Harry Potter and the Chamber of Secrets

相关问题更多 >

编程相关推荐

热门问题

热门文章