分析开放图协议并提取网页摘要的模块。

ExtendedOpenGraph的Python项目详细描述


extendedOpenGraphParser是一个用于解析OpenGraph协议的Python模块。

开放图形协议规范:http://ogp.me/

安装

pip install extendedOpenGraph

功能

  • 基于opengraph。
  • 如果在元标签中不存在打开的图形属性,则能够解析基本元数据。
  • 输入url和html。
  • 输出python字典。
  • 比如Facebook。

用法

input:url

>>> import ExtendedOpenGraph
>>> data = ExtendedOpenGraph.parse(url="http://www.twitter.com")
>>> for key, value in data.items():
...     print "%-15s => %s" % (key, value)
...
url             => http://www.twitter.com
image           => https://abs.twimg.com/a/1373572090/t1/img/front_page/jp-mountain@2x.jpg
type            => website
title           => 트위터

input:html

>>> ex_html="<html><head><title>ExtendOpenGraph</title></head><body><img src='logo.png'/></body></html>"
>>> data = ExtendedOpenGraph.parse(html=ex_html)
>>> for key, value in data.items():
...     print "%-15s => %s" % (key, value)
...
url             => None
image           => logo.png
type            => website
title           => ExtendOpenGraph

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何使用SPARQL从三元组中提取rdf:about或rdf:ID属性?   java如何组合/分离多个json   java如何使用Jackson序列化对象的嵌套集合   Java ProcessBuilder如何从进程捕获文件读取请求并作为流提供?   Java更改JLabel文本更改JLabel位置   如何从Java评估自己的Groovy脚本?   json java下载,然后将图像作为servlet响应写入   java处理多播放器线程和重新绘制   java Selenium如何选择具有可变文本的元素   java动态设置类路径   用字符串Java中的全名替换所有特殊字符的最佳方法是什么?   返回空值的java HashMap   针对空请求体的java Spring bean验证   java API中的“字段摘要”是什么?   jenkins在管道作业中使用多个java版本   java用JAR打开文本文件而不提取帮助   java将JPanel对象添加到单独的JPanel中