如何从一个div中提取文本？

row.exact() u'<tr bgcolor="#f5f9fc">\n\t\t\t<td valign="top" style="text-align:left;"><a href="/search/sites/ABB1836.asp">ABB</a></td>\n\t\t\t<td nowrap valign="top">+1 713 243 7160</td>\n\t\t\t<td valign="top" style="text-align:left;"><a href="http://www.abb.com" target="_blank">www.abb.com</a></td>\t\t\n\t\t</tr>'

2条回答

网友

1楼 · 编辑于 2024-09-29 21:56:20

公司名称、电话和网站的所有三个字段，即文本ABB、713 243 7160和www.abb.com位于三个不同父节点的三个不同子节点中。要提取文本，可以使用以下解决方案：

ABB：

row.xpath(".//td[1]/a/text()").extract()

+1 713 243 7160：

row.xpath(".//td[2]/a/text()").extract()

www.abb.com：

row.xpath(".//td[3]/a/text()").extract()

网友

2楼 · 编辑于 2024-09-29 21:56:20

试试看

//tr/td[1]/a/text() // for Company Name
//tr/td[2]/text() // Telephone
//tr/td[3]/a/text() // Website

编程相关推荐

javascript{“错误”：[“无效图像URL”]}与鸟舍集成
mysql Java语句。executeUpdate（sql）在executeQuery（sql）工作时不工作
在java中反复编辑object/arrayList
java在创建子类实例时是否也创建了超类实例？
如果运行一定次数，java是否仍要生成else？
java gradle eclipse依赖项，跳过testCompile/ProviderRuntime等
java如何用Dozer实例化子类？
java如何在docker容器中高效地构建maven项目？
lambda我想在这个块中转换成java 8流？
java本地广播管理器使用主活动未接收到的警报

相关问题更多 >

编程相关推荐

热门问题

热门文章