个人理科硕士项目
vfm-tool的Python项目详细描述
独立研究项目-ACSE 9
作者
尼古拉斯·特里尼菲
学号:01212102
电子邮件:nicolas.trinephi@imperial.ac.uk
GitHub:acse-nt719
欢迎使用vfm_工具
此软件包包含帝国理工学院ACSE-9个人研究项目“虚拟流量计量深度学习”的代码。通常的做法是通过股权分享生产许可证,从而监控生产流程 至关重要。这个软件包包含了从油井数据中创建数据帧的工具,以及从这些数据中预测油、气和水的速率的机器学习。这些预测可以用来校准现有的物理传感器,也可以扩展为实时监控。在
安装
存储库可以通过Azure DevOps进行克隆:
- 通过下载zip文件并在本地解压缩
- 使用以下命令
git clone https://wintershalldea@dev.azure.com/wintershalldea/Data%20Science/_git/IC-VFM
并导航到所需的存储库。现在您可以使用这些模块,并可以访问提供的图像和笔记本
包只包含模块,因为其他地方有一些未公开的信息。该软件包在PyPI上可用,安装工作如下:
- Databricks群集:
- 通过群集安装PyPI—>;库—>;新建库—>;PyPI—>;进入vfm_工具
- .whl通过群集安装->;库->;上载新->;Python whl->;将.whl文件拖到提示框中
- 在notebook installattion中,通过在单元中运行以下命令,需要在每次群集启动时运行此命令: ^{pr2}$ 在
- 本地:
- 在命令行上运行PyPI安装
在pip install vfm_tool
- 在命令行上运行PyPI安装
包装内容:
vfm_tool/
├── __pycache__/
└── *.cpython-37.pyc
├── __init__.py
├── model.py
├── Pandas_data.py
├── q_control.py
├── Spark_data.py
├── Utils.py
└── visualization.py
关于这个包的其他文档可以在documentation
目录中找到。在您喜爱的浏览器中打开index.html
。在
要求
确保已安装所有依赖项,它们已安装在群集上:
- 在
命令行:
在pip install -r requirements.txt
- 在
Azure Databricks笔记本
在!pip install -r requirements.txt
- 在
小心!Databricks可能需要重启python才能安装mlfow,即使它安装在集群上,在导入mlflow之前运行以下命令:
在dbutils.library.installPyPI("mlflow") dbutils.library.restartPython()
- 在
或者,whl或焦油gz文件可用于安装在Databricks上或本地。在
在
使用
fromvfm_toolimportLSTMmodelinput=pd.DataFrame(my_data)name='model_name'my_model=LSTMmodel.VFM_LSTM(input,name)# creates instance of VFM_LSTM
在Azure Databricks笔记本上,如果模块位于您的工作区目录中,则可以运行这些模块,这些模块的内容将变成global:
不太标准,需要稍微改变语法,并且magic命令必须在它自己的单元中运行。在
%runyour_workspace/vfm_tool/LSTMmodel
input = pd.DataFrame(my_data)
name = 'model_name'
my_model = VFM_LSTM(input, name) # creates instance of VFM_LSTM
演示是以笔记本的形式提供的笔记本目录。在
测试
可以在vfm_tool_tests/目录中找到测试模块。在
许可证
这个存储库使用MIT许可证
版本
当前代码版本是1.11
- 项目
标签: