分析开放图协议并提取网页摘要的模块。

ExtendedOpenGraph的Python项目详细描述


extendedOpenGraphParser是一个用于解析OpenGraph协议的Python模块。

开放图形协议规范:http://ogp.me/

安装

pip install extendedOpenGraph

功能

  • 基于opengraph。
  • 如果在元标签中不存在打开的图形属性,则能够解析基本元数据。
  • 输入url和html。
  • 输出python字典。
  • 比如Facebook。

用法

input:url

>>> import ExtendedOpenGraph
>>> data = ExtendedOpenGraph.parse(url="http://www.twitter.com")
>>> for key, value in data.items():
...     print "%-15s => %s" % (key, value)
...
url             => http://www.twitter.com
image           => https://abs.twimg.com/a/1373572090/t1/img/front_page/jp-mountain@2x.jpg
type            => website
title           => 트위터

input:html

>>> ex_html="<html><head><title>ExtendOpenGraph</title></head><body><img src='logo.png'/></body></html>"
>>> data = ExtendedOpenGraph.parse(html=ex_html)
>>> for key, value in data.items():
...     print "%-15s => %s" % (key, value)
...
url             => None
image           => logo.png
type            => website
title           => ExtendOpenGraph

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
添加了java JButton,但不可见   java在ArrayList的所有可能组合上循环   java是否不需要在构造函数中放入super()?   反射如何检查类是否属于JavaJDK   java列表。toArray(T[]a),如果“T”是“运行时类型”,该怎么办?   字符串连接使用java连接由管道和“:”分隔的整数值   在Java中打开枚举   Windows与Mac上的java正则表达式   java如何在正则表达式中匹配组?   在执行maven安装目标时,不会替换属性文件中的java占位符   java试图在wso2流处理器/流集成器上堆叠siddhi   java从intellij中的maven项目创建jar   java如何在TomEE+中配置Apache CXF ignoreNamespaces?   javajpa获取分离结果   OpenCV 4.3.0 java。Eclipse中的lang.UnsatifiedLinkError   java使用特定大小和特定值创建字节数组