Python中文
首页
教程
问答
标签
搜索
登录
注册
用div刮取特定的表,用scrapy保存文本
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在使用scrapy从一个表中的网站抓取内容。在</p> <p>代码示例:</p> <p/> <pre><code> <tr> <td><div>2018/2058</div></td> <td class="address"><div>Land North of 37 and 39 Hare Lane Claygate Esher Surrey KT10 9BT</div></td> <td class="proposal"><div>Confirmation of Compliance with Conditions: 5 (Tree Protection and Pre-Commencement Inspection) and 6 (Tree Protection) of planning permission 2017/0451.</div></td> <td><div style="min-width:90px">Claygate Ward</div></td> </tr> </code></pre> <p>但是,正如您可以看到的那样,文本位于每个“tr”标记的div中,如何使用xpath或css选择器获取文本?在</p> <p>我试过了</p> ^{pr2}$ <p>以下是网站:</p> <p><a href="http://emaps.elmbridge.gov.uk/ebc_planning.aspx?requesttype=parsetemplate&template=WeeklyListAVDetailTab.tmplt&basepage=ebc_planning.aspx&Filter=%5Eid%5E=%271%27&history=8a016b5504894a589b75179582da69ca&todatetext:PARAM=06%20July%202018&count:PARAM=63&id:PARAM=1&pagerecs=500&maxrecs=500" rel="nofollow noreferrer">http://emaps.elmbridge.gov.uk/ebc_planning.aspx?requesttype=parsetemplate&template=WeeklyListAVDetailTab.tmplt&basepage=ebc_planning.aspx&Filter=^id^=%271%27&history=8a016b5504894a589b75179582da69ca&todatetext:PARAM=06%20July%202018&count:PARAM=63&id:PARAM=1&pagerecs=500&maxrecs=500</a></p> <p>提前谢谢!在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你可以很容易地使用熊猫。在</p> <pre><code>table = pd.read_html(url) </code></pre> <p>现在表是一个包含完整表的数据帧</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
文本导入时标题行中的特殊字符
3 回答
文本小部件:在没有输入时更新并在循环后保持空闲
10 回答
文本小部件tkin
1 回答
文本小部件tkinter中的标签更改或文本外观更改是否有撤消功能?
6 回答
文本小部件tkinter复制图像选项
2 回答
文本小部件上的Python Tkinter ttk滚动条未缩放
8 回答
文本小部件上的滚动条可能需要根据制表符ord显示前进行滚动
9 回答
文本小部件不显示lis中的内容
9 回答
文本小部件不显示Unicode字符
8 回答
文本小部件中写入的行间距
9 回答
文本小部件中的文本作为变量
4 回答
文本小部件中的滚动条仅显示在底部
3 回答
文本小部件中的选项卡键空间计数
2 回答
文本小部件作为Lis
3 回答
文本小部件在主框架中扩展列宽
6 回答
文本小部件未使用删除功能清除
9 回答
文本小部件滚动动画(Tkinter、Python)
10 回答
文本居中。格式正确吗?
6 回答
文本差分算法
6 回答
文本已知时音频文件中的单词索引
2 回答