信息检索的机器学习库
ml4ir的Python项目详细描述
ml4ir Python快速入门
有关更详细的使用文档,请查看ml4ir.readthedocs.io
目录
安装
使用ml4ir作为库
要求
- python3.{6,7}(tf2.0.3不适用于python3.8)
- pip3
可以使用以下命令将ml4ir安装为pip包
pip3 install ml4ir
这将从PyPI安装ml4ir-0.0.2(当前版本)。在
使用ml4ir作为工具箱或帮助ml4ir
首先克隆ml4ir
^{pr2}$您可以使用docker或virtualenv在ml4ir上使用和开发
Docker(推荐)
要求
- docker(18.09+测试)
- docker-compose
我们已经建立了一个docker-compose.yml
文件来构建和使用docker容器来训练模型。在
将工作目录更改为python包
cd path/to/ml4ir/python/
构建docker映像并运行单元测试
docker-compose up --build
只生成ml4ir docker映像而不运行测试
docker-compose build
虚拟环境
要求
- python3.{6,7}(tf2.0.3不适用于python3.8)
- pip3
将工作目录更改为python包
cd path/to/ml4ir/python/
安装virtualenv
pip3 install virtualenv
在git存储库中创建新的python3虚拟环境(它是.gitignored,不用担心)
python3 -m venv env/.ml4ir_venv3
激活virtualenv
source env/.ml4ir_venv3/bin/activate
安装所有依赖项
pip3 install --upgrade setuptools
pip install --upgrade pip
pip3 install -r requirements.txt
设置PYTHONPATH环境变量以指向python包
export PYTHONPATH=$PYTHONPATH:`pwd`
关于贡献的说明
预提交钩子是必需的,并且作为对ml4ir的贡献的一个需求而安装。
如果错误导致他们没有安装,请执行pre-commit install
在.git/目录中安装git钩子。在
使用
<4a<4ir>ml4ir的培训或评估功能的入口点是通过ml4ir/base/pipeline.py
,对于特定于应用程序的覆盖,请查看`ml4ir/applications/<;eg:ranking>/管道.py在
当前支持的管道:
- 在
在ml4ir/applications/ranking/pipeline.py
- 在
在ml4ir/applications/classification/pipeline.py
要运行ml4ir排名管道以进行培训、评估和/或测试,请使用
docker-compose run ml4ir \
python3 ml4ir/applications/ranking/pipeline.py \
<args>
排名训练预测与评价流水线实例
docker-compose run ml4ir \
python3 ml4ir/applications/ranking/pipeline.py \
--data_dir ml4ir/applications/ranking/tests/data/tfrecord \
--feature_config ml4ir/applications/ranking/tests/data/config/feature_config.yaml \
--run_id test \
--data_format tfrecord \
--execution_mode train_inference_evaluate
有关更多用法示例,请检查:
ml4ir作为库
<> P>深度学习lib库使用相关知识模型建立相关模型,查看下面的{ CD6}} /P>- 在
学习排名:这本
在PointwiseRankingDemo
笔记本自下而上地引导你完成一个RelevanceModel
的构建、培训、储蓄和整个生命周期。您还可以在其中找到有关ml4ir体系结构的详细信息。在 - 在
文本分类:
在EntityPredictionDemo
笔记本将指导您完成对模型的培训,以根据用户上下文和查询预测实体类型。在
输入以下命令在浏览器上启动Jupyter notebook以运行上述笔记本
jupyter-notebook
运行测试
在ml4ir
下运行所有基于python的测试
使用docker
docker-compose up
使用virtualenv
python3 -m pytest
要运行特定的测试
python3 -m pytest /path/to/test/module
- 项目
标签: