colab.research.谷歌.com笔记本超过了limi的大小

2024-10-02 00:33:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用以下代码:

import requests
import re
import pandas as pd
page = requests.get("http://portfoliodeagencias.meioemensagem.com.br/anuario/propaganda/agencias/listacompleta")
conteudo_pagina = page.content
string_conteudo_pagina = conteudo_pagina.decode("UTF-8")
lista_de_contato = {}

agencias = re.findall(r'<strong class=\"titu-nome-free\">(.*?)</strong></a></li>\n',str(string_conteudo_pagina))

i=0
while i < 10:
  for nome in agencias:
    if re.search(r'<li><a> <strong class=\"titu-tel-free\">(.*?)</strong>\n',str(string_conteudo_pagina)).start() < re.search(r'<li><a href=\"(.*?)\"><strong',str(string_conteudo_pagina)).start():
      lista_de_contato[nome] = re.findall(r'<li><a> <strong class=\"titu-tel-free\">(.*?)</strong>\n',str(string_conteudo_pagina)),re.findall(r'<li><a href=\"(.*?)\"><strong',str(string_conteudo_pagina))
      string_conteudo_pagina[re.search(r'<li><a href=\"(.*?)\"><strong',str(string_conteudo_pagina)).start():]
      i = i+1
    else:
      lista_de_contato[nome] = re.findall(r'<li><a> <strong class=\"titu-tel-free\">(.*?)</strong>\n',str(string_conteudo_pagina)),'0'
      string_conteudo_pagina[re.search(r'<li><a> <strong class=\"titu-tel-free\">(.*?)</strong>\n',str(string_conteudo_pagina)).start():]
      i = i+1

lista_de_contato

我得到以下信息:

^{pr2}$

有没有办法让这个代码在大小限制方面做得更好?在

tks公司


Tags: refreestringdeliclassstrongstr
1条回答
网友
1楼 · 发布于 2024-10-02 00:33:32

您的笔记本超出了大小,而不是您的代码。在

您的最后一行,lista_de_contato,它正在向您的笔记本输出数据。在

这让笔记本变大了,而不是你的代码。在

作为建议,我会尽量限制显示。例如,如果您将数据存储在pandas数据框中,则会自动限制显示。我总是试着从pandas数据帧中获取数据,因为它们很容易导出,也很容易摆弄。在

另外,如果你需要的话,我也是巴西人,可能会帮上忙(我假设你也是巴西人,因为你在刮一个巴西广告网站)

相关问题 更多 >

    热门问题