pandas read_html错误:找不到我想要的表

2024-06-18 13:14:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我想从这个链接获取表:https://radarintermediacoes.com.br/compra-e-venda-de-negocios/estacionamento-no-centro-17/

我试图通过以下代码获取信息:

import pandas as pd
import requests
    
url = "https://radarintermediacoes.com.br/compra-e-venda-de-negocios/estacionamento-no-centro-17/"
    
    
header = {
  "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36",
  "X-Requested-With": "XMLHttpRequest"
}

r = requests.get(url, headers=header)

data = pd.read_html(r.text)
data

有了这段代码,我只能得到我想要的表中的一个,表“DESPESAS FIXAS/VARIÁVEIS”,但我也想要表“DETALHES DO NEGÓCIO”

我希望我能得到一些帮助或建议,谢谢


Tags: no代码httpsbrimportcomderequests
1条回答
网友
1楼 · 发布于 2024-06-18 13:14:18

您正在查找的数据不在<table>标记内,因此熊猫看不到它。但是您可以使用BeautifulSoup解析数据,例如:

import requests
import pandas as pd
from bs4 import BeautifulSoup
  

url = "https://radarintermediacoes.com.br/compra-e-venda-de-negocios/estacionamento-no-centro-17/"
soup = BeautifulSoup(requests.get(url).content, 'html.parser')  

all_data = []
for li in soup.select('div.panel-heading:contains("Detalhes do Negócio") + div li'):
    a, v = li.strong.text, li.strong.find_next_sibling(text=True)
    all_data.append({'Attribute': a.strip(':'), 'Value': v})

df = pd.DataFrame(all_data)
print(df)

印刷品:

                  Attribute                                  Value
0           TIPO DE NEGÓCIO                        Estacionamentos
1                    REGIÃO                                 Centro
2        FATURAMENTO MENSAL                           R$ 13.500,00
3             LUCRO LÍQUIDO                            R$ 3.000,00
4    NÚMERO DE FUNCIONÁRIOS                                      1
5         TEMPO DE CONTRATO                                 3 anos
6  HORÁRIO DE FUNCIONAMENTO      Segunda a sexta ds 07:00 as 19:00
7    CONDIÇÕES DE PAGAMENTO   50% de entrada e restante em 30 dias
8                     PREÇO                            R$50.000,00

相关问题 更多 >