HDX Python通用geonode scraper

hdx-scraper-geonode的Python项目详细描述


Build StatusCoverage Status

HDX Scraper Geonode库可以轻松构建用于提取数据的Scraper 从geonode服务器。在

使用

图书馆有详细的API文档,可以找到 这里:http://ocha-dap.github.io/hdx-scraper-geonode/。代码 图书馆在这里:https://github.com/ocha-dap/hdx-scraper-geonode。在

GeoNodeOhdx类

您应该创建GeoNodeToHDX类的对象:

geonodetohdx = GeoNodeToHDX('https://geonode.wfp.org', downloader)
geonodetohdx = GeoNodeToHDX('https://geonode.themimu.info', downloader)

它有高级方法生成数据集 删除其他\u数据集:

^{pr2}$

如果您需要更细粒度的控制,它有低级方法 获取位置数据、获取图层数据、生成数据集和展示:

# get countries where count > 0
countries = geonodetohdx.get_countries(use_count=True)
# get layers for country with ISO 3 code SDN
layers = geonodetohdx.get_layers(countryiso='SDN')
# get layers for all countries
layers = get_layers(countryiso=None)

将忽略和默认项。这些可以通过 使用以下格式的新配置创建YAML配置:

ignore_data:
  - deprecated

category_mapping:
  Elevation: 'elevation - topography - altitude'
  'Inland Waters': river

titleabstract_mapping:
  bridges:
    - bridges
    - transportation
    - 'facilities and infrastructure'
  idp:
    camp:
      - 'displaced persons locations - camps - shelters'
      - 'internally displaced persons - idp'
    else:
      - 'internally displaced persons - idp'

ignore_data是抽象中表示数据集的任何术语 不应添加到HDX。在

类别映射是类别字段category\u gnu description的映射 到HDX元数据标记。在

titleabstract_映射是从标题或摘要中的术语到 HDX元数据标记。在

为您检索更细粒度的字典 直接操纵它们:

geonodetohdx = GeoNodeToHDX('https://geonode.wfp.org', downloader)
ignore_data = geonodetohdx.get_ignore_data() 
category_mapping = geonodetohdx.get_category_mapping() 
titleabstract_mapping = geonodetohdx.get_titleabstract_mapping()         

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
来自偏移量的java JavaPairInputStream流   gzip Java TarInputStream读取tar的文件名。包含另一个tar的gz文件。gz文件   如何在Linux shell脚本中确定和使用实际的java路径   java请求太多FirebaseError   java错误json解析   java在localserver上发送安卓应用程序的输出   JavaSpring:启动和停止webapplication时更新DBtable条目   java如何使用JavaFX在矩形处设置文本?   java SQL查询在Hibernate中出现异常   java我无法使用javamail代码通过outlook(hotmail帐户)配置发送邮件,但在gmail中工作正常   java是不同的持久性。测试运行/JPA装置的xml属性   无头Eclipse的java导出战   使用ContentVersionStrategy的java Spring引导缓存禁止使用gzip进行资源压缩   java如何获取计算机的设备令牌?   图像文件的java ImageInfo不包含有效值   继承强制在Java中使用基类方法