Python中文
首页
教程
问答
标签
搜索
登录
注册
从HTML页面提取内容(不包括导航)的python方法
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>当然,可以使用任意数量的python解析器来解析HTML页面,但是我很惊讶,似乎没有任何公共解析脚本从给定的HTML文档中提取有意义的内容(不包括边栏、导航等)。在</p> <p>我猜这类似于收集DIV和p元素,然后检查它们是否有最少的文本内容,但我确信一个可靠的实现将包含很多我没有想到的东西。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以使用<a href="http://boilerpipe-web.appspot.com/" rel="nofollow">boilerpipe Web application</a>动态获取和提取内容。在</p> <p>(这不是Python特有的,因为您只需要向googleappengine上的页面发出httpget请求)。在</p> <p>干杯</p> <p>基督徒</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
VirtualEnvRapper错误:路径python2(来自python=python2)不存在
6 回答
virtualenvs上的pyinstaller,没有名为导入错误的模块
5 回答
virtualenvs是否可以退回到用户包而不是系统包?
9 回答
virtualenvwrapper CentOS7
4 回答
virtualenvwrapper IOError:[Errno 13]权限被拒绝
1 回答
virtualenvwrapper mkproject和shell在windows中的启动问题?
7 回答
virtualenvwrapper mkvirtualenv不工作但没有错误
6 回答
Virtualenvwrapper python bash
2 回答
virtualenvwrapper:“workon”何时更改到项目目录?
7 回答
virtualenvwrapper:mkvirtualenv可以工作,但是rmvirtualenv返回bash:没有这样的文件或目录
7 回答
virtualenvwrapper:virtualenv信息存储在哪里?
9 回答
virtualenvwrapper:命令“python设置.pyegg_info“失败,错误代码为1
10 回答
virtualenvwrapper:如何将mkvirtualenv的默认Python版本/路径更改为ins
4 回答
Virtualenvwrapper:模块“pkg_resources”没有属性“iter_entry_points”
1 回答
Virtualenvwrapper:没有名为virtualenvwrapp的模块
8 回答
Virtualenvwrapper.bash_profi的正确设置
6 回答
Virtualenvwrapper.hook:权限被拒绝
4 回答
virtualenvwrapper.sh:fork:资源暂时不可用Python/Djang
6 回答
Virtualenvwrapper.shlssitepackages命令不工作
7 回答
Virtualenvwrapper.sh函数在bash sh中不可用
1 回答