Juypter笔记本未打印文本部分

import requests import bs4 import pickle from bs4 import BeautifulSoup def url_to_transcript(url): page = requests.get(url).text soup = BeautifulSoup(page, "lxml") text = [p.text for p in soup.find(class_="post-content").find_all('p')] print(url) return text urls = ['https://scrapsfromtheloft.com/2020/04/25/chris-d-elia-white-male-black-comic-transcript/'] writer = ['chris'] for i in urls: transcript=url_to_transcript(i) print(transcript)

1条回答

网友

1楼 · 发布于 2024-06-25 23:42:42

虽然您的问题没有显示此变量是如何生成的，但假设transcripts是一个包含文本的列表列表，则可以在以下输出中看到差异：

>>> import pickle
>>> transcripts = [["first_{}".format(i), "second_{}".format(i)] for i in range(3)]
>>> transcripts
[['first_0', 'second_0'], ['first_1', 'second_1'], ['first_2', 'second_2']]
>>> i=0
>>> pickle.loads(pickle.dumps("transcripts[i]"))
'transcripts[i]'
>>> pickle.loads(pickle.dumps(transcripts[i]))
['first_0', 'second_0']
>>>

在第一个调用中，pickle只是pickle文本“transcripts[i]”，而在第二个调用中（不带引号），它将pickle位置i中transcript引用的值

请注意，python中没有将单数名称转换为复数的魔力，因此需要显式声明/填充它，如下所示：

transcripts = []
for i in urls:
    transcript=url_to_transcript(i)
    print(transcript)
    transcripts.append(transcript)

如果您的代码没有显式声明transcripts，那么用引号将其括起来可以解决NameError异常，但可能不是您想要的方式

相关问题更多 >

编程相关推荐

热门问题

热门文章