colab.research.谷歌.com笔记本超过了limi的大小

import requests import re import pandas as pd page = requests.get("http://portfoliodeagencias.meioemensagem.com.br/anuario/propaganda/agencias/listacompleta") conteudo_pagina = page.content string_conteudo_pagina = conteudo_pagina.decode("UTF-8") lista_de_contato = {} agencias = re.findall(r'(.*?)</a></li>\n',str(string_conteudo_pagina)) i=0 while i < 10: for nome in agencias: if re.search(r'<li><a> (.*?)\n',str(string_conteudo_pagina)).start() < re.search(r'<li><a href=\"(.*?)\"><strong',str(string_conteudo_pagina)).start(): lista_de_contato[nome] = re.findall(r'<li><a> (.*?)\n',str(string_conteudo_pagina)),re.findall(r'<li><a href=\"(.*?)\"><strong',str(string_conteudo_pagina)) string_conteudo_pagina[re.search(r'<li><a href=\"(.*?)\"><strong',str(string_conteudo_pagina)).start():] i = i+1 else: lista_de_contato[nome] = re.findall(r'<li><a> (.*?)\n',str(string_conteudo_pagina)),'0' string_conteudo_pagina[re.search(r'<li><a> (.*?)\n',str(string_conteudo_pagina)).start():] i = i+1 lista_de_contato

1条回答

网友

1楼 · 发布于 2024-10-02 00:33:32

您的笔记本超出了大小，而不是您的代码。在

您的最后一行，lista_de_contato，它正在向您的笔记本输出数据。在

这让笔记本变大了，而不是你的代码。在

作为建议，我会尽量限制显示。例如，如果您将数据存储在pandas数据框中，则会自动限制显示。我总是试着从pandas数据帧中获取数据，因为它们很容易导出，也很容易摆弄。在

另外，如果你需要的话，我也是巴西人，可能会帮上忙（我假设你也是巴西人，因为你在刮一个巴西广告网站）

相关问题更多 >

编程相关推荐

热门问题

热门文章