我有一个使用seleniumpython的web抓取代码,并且意识到我不需要运行任何javascript,所以为了提高效率,我将它“翻译”为urllib.requests请求美丽的群像。我有一个问题,就是在读取表格时,试图模仿selenium的“.text”属性所做的工作。BeautifulSoup似乎没有这么简单的方法来阅读表格。当尝试在Selenium模块中搜索“.text”属性是如何编码的时,我想我不知道如何查找此类信息。有人能帮我弄清楚这个信息吗。哪里解释了如何从html中检索这个atribute?你知道吗
Example_url = "http://www4.tjrj.jus.br/consultaProcessoWebV2/consultaMov.do?v=2&numProcesso=2008.001.000272-2&acessoIP=internet&tipoUsuario="
当我尝试硒元素时:
driver.get(Example_url)
driver.find_element_by_xpath('//*[@id="content"]/form/table/tbody').text
我得到了期望的结果(示例)
“作为法律上的信息,我们需要制定一个公共政策,以确保公共利益和公共利益的实现。\n\n程序编号0000184-70.2008.8.19.0001\n2008.001.000272-2\n TJ/RJ-16/11/2018 06:50:45\n ARQUIVADO EM DEFINITIVO-MAÇo nº1706,em 02/07/2012\n首都科马卡11ª瓦拉刑事法庭\n里约11ª瓦拉刑事法庭\n恩德雷索:Av。Erasmo Braga 115 L II sala 504\n巴罗:中心\n中心:里约热内卢\n登记处:3ºOfício de Registro de Distributição\nAsunto:富托(第。155-CP)C/C犯罪,第二类\n类别:Aço刑罚-里约刑事诉讼\n里约热内卢公共行政部门\n Listar alteraões/exclusões DE personagens \n Advogado(s):TJ000002-DEFENSOR PÚBLICO \n Tipo DO Movimento:Arquivalento\nData DE Arquivalento:02/07/2012\nTipo DE Arquivalmento:definitivo\nMaç:1706\nMaço recebido pelo arquivo em:09/07/2012\nLocal de Arquivalento:arquivo Geral-Rio de Janeiro\n Tipo do Movimento:Revogaçço da Suspensionão do Processo(第。89 da Lei 9099)\n日期:2012年7月1日\n日期:2012年2月6日\n描述:Ag。巴伊萨的经验。Ofício eletrônico nº206539271 ao 3ºORD em 14/02/2012,devidamente cumprido em 18/06/2012。过程如下。\n Tipo do Movimento:Ato ordinantório Praticado\nda:17/01/2012\n描述:devolvido da digitaçço\n Tipo do Movimento:digitaço de Documentos\nData da digitaço:17/01/2012\n Tipo do Movimento:Ato ordinantório Praticado\nda:06/01/2012\n描述:para fazer comunicaçes de praxe。\n Tipo do Movimento:《实践条例》\n日期:2012年1月6日\n描述:Certifico que a r.sentença de fls。111/112,transitou em julgado,第4部分,em 04/11/2011“…(续)
在我的位置,当我在浏览器中解决它之后,我在控制台中运行
document.cookie
来获取cookie。你知道吗假设javascript不需要运行。我将在您指定的时间内进行测试。你知道吗
我可能会先试着取回这张桌子
否则,CSS选择器将使用请求以表为目标。你知道吗
关于解决方案的几句话:
http://www4.tjrj.jus.br/consultaProcessoWebV2/consultaMov.do?v=2&numProcesso=2008.001.000272-2&acessoIP=internet&tipoUsuario=%22
使用JavaScript。所以光是urllib.requests
和BeautifulSoup
可能帮不了我们。你知道吗.text
的等价物是getText()代码块:
控制台输出:
相关问题 更多 >
编程相关推荐