将数据包管道与ckan集成
ckanext-datapackage-pipelines的Python项目详细描述
#ckanext-datapackage_管道
[![ckan pipelines服务器docker image:orihoch/datapackage pipelines ckan](https://img.shields.io/badge/ckan%20pipelines%20server%20docker%20image orihoch/datapackage--pipelines--ckanext darkgreen.svg)](https://hub.docker.com/r/orihoch/datapackage pipelines ckanext/)
integrate[数据包管道](https://github.com/frictionlessdata/datapackage-pipelines)带有ckan
最低支持的ckan版本:2.8.1
*` sudo chown-r$user:$group/var/ckan`
*此目录应在管道服务器和ckan之间共享
*激活ckan虚拟环境
*将ckanext-datapackage\u管道包安装到虚拟环境中:
*`pip install ckanext-datapackage\u pipelines`
*将“datapackage\u管道”添加到` ckan.plugins`在ckan中设置
*重新启动ckan。
\同样的主机,您应该修改端口以防止与端口6379上运行的管道服务器redis发生冲突。
pipelines服务器在端口5050上运行。
````
docker run-v/var/ckan/pipelines:/pipelines:rw\
-eckan-api-key=***\
-eckan-url=http://localhost:5000\
--net=host\
orihoch/datapackage pipelines ckanext server
```
*` register_pipelines`-返回要从中获取插件的
管道的管道名称(通常是插件的名称)和目录。重新启动ckan时,默认情况下,管道将复制到/var/ckan/pipelines-此目录应在ckan和管道服务器之间共享。如果插件管道目录包含“requirements.txt”,则会在管道服务器重新启动时安装该目录。
*`get_pipeline s_config`-返回包含插件配置或管道处理器应可用的其他数据的键值对的dict。
使用“datapackage_pipelines_ckanext.helpers.get_plugin_configuration(plugin_name)”配置。
>以下管道处理器可用:
*`ckanext.dump_to_path`-与标准库“dump.to_path”相同,但转储到ckan数据目录。
*参数:
*`plugin`:**必需**插件的名称
*` out path`:插件数据目录内的相对路径
*`ckanext.load戥resource`-与标准库“load戥resource”相同,但从ckan数据目录加载。
*参数:
*`path`:**必需**插件数据目录中数据包的相对路径
*`plugin`:**必需**name
以支持管道依赖性,将“pipeline-spec.yaml”重命名为“ckanext.source-spec.yaml`
下面是一个示例管道规范,其中“下载数据”管道将按计划运行
,在每次计划运行之后,“将数据加载到ckan”管道将运行:
```
下载数据:
计划:
crontab:“1 2**”
管道:
-…
将数据加载到ckan:
依赖项:
-ckanext管道:您的插件名称下载数据
````
ckan插件配置
````
ckanext.datapackage_pipelines.directory=/var/ckan/pipelines
ckanext.datapackage_pipelines.dashboard_url=http://localhost:5050
```
[![ckan pipelines服务器docker image:orihoch/datapackage pipelines ckan](https://img.shields.io/badge/ckan%20pipelines%20server%20docker%20image orihoch/datapackage--pipelines--ckanext darkgreen.svg)](https://hub.docker.com/r/orihoch/datapackage pipelines ckanext/)
integrate[数据包管道](https://github.com/frictionlessdata/datapackage-pipelines)带有ckan
最低支持的ckan版本:2.8.1
*` sudo chown-r$user:$group/var/ckan`
*此目录应在管道服务器和ckan之间共享
*激活ckan虚拟环境
*将ckanext-datapackage\u管道包安装到虚拟环境中:
*`pip install ckanext-datapackage\u pipelines`
*将“datapackage\u管道”添加到` ckan.plugins`在ckan中设置
*重新启动ckan。
\同样的主机,您应该修改端口以防止与端口6379上运行的管道服务器redis发生冲突。
pipelines服务器在端口5050上运行。
````
docker run-v/var/ckan/pipelines:/pipelines:rw\
-eckan-api-key=***\
-eckan-url=http://localhost:5000\
--net=host\
orihoch/datapackage pipelines ckanext server
```
*` register_pipelines`-返回要从中获取插件的
管道的管道名称(通常是插件的名称)和目录。重新启动ckan时,默认情况下,管道将复制到/var/ckan/pipelines-此目录应在ckan和管道服务器之间共享。如果插件管道目录包含“requirements.txt”,则会在管道服务器重新启动时安装该目录。
*`get_pipeline s_config`-返回包含插件配置或管道处理器应可用的其他数据的键值对的dict。
使用“datapackage_pipelines_ckanext.helpers.get_plugin_configuration(plugin_name)”配置。
>以下管道处理器可用:
*`ckanext.dump_to_path`-与标准库“dump.to_path”相同,但转储到ckan数据目录。
*参数:
*`plugin`:**必需**插件的名称
*` out path`:插件数据目录内的相对路径
*`ckanext.load戥resource`-与标准库“load戥resource”相同,但从ckan数据目录加载。
*参数:
*`path`:**必需**插件数据目录中数据包的相对路径
*`plugin`:**必需**name
以支持管道依赖性,将“pipeline-spec.yaml”重命名为“ckanext.source-spec.yaml`
下面是一个示例管道规范,其中“下载数据”管道将按计划运行
,在每次计划运行之后,“将数据加载到ckan”管道将运行:
```
下载数据:
计划:
crontab:“1 2**”
管道:
-…
将数据加载到ckan:
依赖项:
-ckanext管道:您的插件名称下载数据
````
ckan插件配置
````
ckanext.datapackage_pipelines.directory=/var/ckan/pipelines
ckanext.datapackage_pipelines.dashboard_url=http://localhost:5050
```