从网站中提取社交媒体链接

extract-social-media的Python项目详细描述


提取社交媒体

https://img.shields.io/pypi/v/extract-social-media.svghttps://img.shields.io/pypi/pyversions/extract-social-media.svghttps://img.shields.io/travis/fluquid/extract-social-media.svgCoverage StatusRequirements Status

从网站中提取社交媒体链接。

许多网站引用他们的facebook、twitter、linkedin、youtube帐户 这些信息对于收集公司的360度信息是非常宝贵的。

此库允许提取最常用的 国际社交媒体网络。

  • 自由软件:麻省理工学院许可证
  • python版本:2.7、3.4+

功能

  • 从HTML内容中提取社交媒体链接/句柄
  • 尝试从窗口小部件、脚本等中提取链接/句柄。
  • 支持最广泛使用的社交网络
    • Facebook
    • LinkedIn
    • 推特
    • YouTube
    • Github
    • Google Plus
    • Pinterest
    • Instagram
    • 快照聊天
    • 活动板
    • flickr
    • 微博
    • 潜望镜
    • 电报
    • 声云
    • 加料燃烧器
    • 维梅奥
    • 幻灯片
    • Vkontakte
    • < > ><

快速启动

importrequestsfromhtml_to_etreeimportparse_html_bytesres=requests.get('https://techcrunch.com/contact/')tree=parse_html_bytes(res.content,res.headers.get('content-type'))set(find_links_tree(tree)){'http://pinterest.com/techcrunch/','http://www.youtube.com/user/techcrunch','http://www.linkedin.com/company/techcrunch','https://www.facebook.com/techcrunch','https://flipboard.com/@techcrunch','http://instagram.com/techcrunch','https://plus.google.com/+TechCrunch','https://instagram.com/techcrunch','https://twitter.com/techcrunch'}

注意事项

  • 当前在页面上查找所有社交媒体链接
    • 需要根据链接位置查找最相关的链接, 链接上下文、公司名称等。

学分

这个包是用Cookiecutterfluquid/cookiecutter-pypackage项目模板创建的。

历史记录

0.4.0(2017-08-18)

  • 天真地将照片、视频、搜索、推特等列入黑名单。

0.3.0(2017-08-18)

  • 修正了“Href”为空或非字符串时的异常

0.2.0(2017-06-08)

  • 更好的测试覆盖率
  • 接受数据

0.1.0(未发布)

  • pypi上的第一个版本。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
“java.lang.TypeNotPresentException:键入org.hibernate.SessionFactory不存在”   java如何添加两个内容为number的字符数组?   java变量未初始化我必须设置一个变量,而不是仅仅在if语句中添加它吗?   在Java中,main和constructor可以一起在一个类中吗   安卓在java中拖动多个按钮视图   字符串读写文件Java空空间   java在使用Moshi JsonAdapter反序列化时丢失字段值。工厂   如何在Java中使用for循环和扫描程序添加数组   在java andriod中使用notifyDataSetChanged()后,安卓 Arraylist未重新填充   java枚举类型中的方法能否更改枚举实例的状态?   java pbkdf2盐渍哈希密码验证   java Maven jgit JDWP传输错误   基于浏览web内容的java用户行为分析   java为什么我在STS中遇到编译错误   java Spring引导REST获取HTTPConnectionURL的参数   在JFrame中使用JPanel的java无法正确调整大小或移动   java泛型遗留兼容性问题   java将动态表单上的类对象传递给意图对象