缺少Azure Batch data science VM python包

2024-09-30 06:16:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用的是linuxdsvm映像:microsoft-dsvm linux-data-science-vm-ubuntu linuxdsvmubuntu

我的python代码在第一行import pandas as pd失败,出现python错误,module not found。在

当我远程SSH到节点并运行pip install pandas时,它告诉我它已经安装好了。numpy等也一样

我试图用/bin/bash -c "pip install pandas"等设置一个启动任务,但是失败了,因为找不到pip命令。在

同样,当从sshshell运行时,pip在路径上,运行它没有问题。在

谁能给我指出正确的方向吗?在

微软的简单教程工作得很好,因为它们不依赖任何外部软件包。所以我可以将python文件和数据集等从blob存储上传到机器上。python运行正常。这就像所有特定于datascience的包和pip在任务运行时丢失一样,但是当我通过SSH进入节点时,pip就会丢失。在

另外一个问题是,jupyter应该在8000端口上运行吗?在


Tags: installpip代码pandasdata节点ubuntulinux
1条回答
网友
1楼 · 发布于 2024-09-30 06:16:38

首先,必须在计算节点中安装pip。在

bin/bash -c "sudo apt-get -y update && export DEBIAN_FRONTEND=noninteractive && sudo apt-get install -y python3-pip && sudo pip3 install pandas;"

将此命令作为启动任务提供给azure批处理池,该批处理池将在您的虚拟机中安装pip和pandas。在

以同样的方式将所有要安装的库放在要求.txt并在安装pip之后给出sudo pip3 install -r requirements.txt。在

相关问题 更多 >

    热门问题