易于使用的模块,用于简化从位置对国家的解析
easy-geoparsing的Python项目详细描述
简易地质放火
易于使用的模块,用于简化对来自纯文本位置和顶级域的国家的解析,以及对国家名称和ISO 2&3字符代码的操作。
实现依赖于:
- RESTcountriesapi
- geotext模块
安装
要通过pip从命令行安装,请执行以下操作:
pip install easy-geoparsing
要通过pip
升级到最新版本,请执行:
pip install easy-geoparsing --upgrade
要通过pipenv使用,请在pip文件中放入以下内容:
[packages]
easy-geoparsing = ">=1.0.0"
开发
如果您已经克隆了存储库,最好的方法是使用pipenv
如果您还没有pipenv
,可以使用pip
从命令行安装它:
pip install pipenv --upgrade
然后,在这个存储库的顶层目录中,easy-geoparsing
,do:
pipenv install --dev
这将创建虚拟环境并安装需求(在pip文件中可见)。--dev
标志将安装测试等所需的软件包。
用法
开始
执行以下操作以获取解析器实用程序,注意创建EasyCountryParser
实例将自动从restcountries下载国家/地区数据负载并设置所有资源。因此,速度将取决于您的互联网连接,但有效载荷不是很大。
from easy_geoparsing import EasyCountryParser
ez_parser = EasyCountryParser()
或者,如果您不想在某些国家使用我们的替代名称(即您希望完全遵循restcountries标准)
ez_parser = EasyCountryParser(altnames=False)
EasyCountryParser
类基于restcountries api和geotext自然语言解析器库中的数据提供实用程序,以便轻松地提取和处理国家名称和代码。
解析器由以下资源初始化:
.data
-包含restcountries数据的pandas数据框.tld_to_a2c
-python dict,将tld映射到2个字符的iso代码.tld_to_a3c
-python dict,将tld映射到3个字符的iso代码.iso2to3
-python dict,将2个字符的iso代码映射到3.iso3to2
-python dict,将3个字符的iso代码映射到2.a2c_map
-python dict,将2个字符的iso代码映射到全名.a3c_map
-python dict,将3个字符的iso代码映射到全名
解析器有以下处理位置数据的方法:
.retrieve_country
-解析可提取的国家/地区2字符ISO代码的纯文本(然后可以使用上面的映射器对其进行操作)