MS Azure autoML准备错误文件格式/编码错误？

######################################## #Case 1, Error returned data= "\\\dwdf219\\...\\bankmarketing_train.csv" dflow = dprep.auto_read_file(data) dflow.get_profile() X_train = dflow.drop_columns(columns=['y']) y_train = dflow.keep_columns(columns=['y'], validate_column_exists=True) dflow.head() # Train automl_settings = { "iteration_timeout_minutes": 10, "iterations": 5, "n_cross_validations": 2, "primary_metric": 'AUC_weighted', "preprocess": True, "max_concurrent_iterations": 5, "verbosity": logging.INFO, } automl_config = AutoMLConfig(task = 'classification', debug_log = 'automl_errors.log', path = project_folder, run_configuration=conda_run_config, X = X_train, y = y_train, **automl_settings ) remote_run = experiment.submit(automl_config, show_output = True) ######################################## #Case 2, all works fine data = "https://automlsamplenotebookdata.blob.core.windows.net/automl-sample-notebook-data/bankmarketing_train.csv" dflow = dprep.auto_read_file(data) dflow.get_profile() X_train = dflow.drop_columns(columns=['y']) y_train = dflow.keep_columns(columns=['y'], validate_column_exists=True) dflow.head() # Train ... ###################################

1条回答

网友

1楼 · 发布于 2024-06-02 16:04:52

对于远程运行，传递给dprep的文件在远程上使用，因此必须在远程（Linux）上访问该文件。在

Linux远程可以理解https和数据存储，但无法处理Windows样式的文件共享。（\\dwdf219\…\bankmarketing_火车.csv在这种情况下）

一种解决方案是通过数据存储传递数据。在

您可以使用以下方法上载到数据存储：

ds = ws.get_default_datastore()
ds.upload(src_dir='./myfolder', target_path='mypath', overwrite=True, show_progress=True)

然后在auto_read_文件中使用数据存储引用：

^{pr2}$

示例笔记本auto-ml-remote-amlcompute.ipynb显示了这一点。在

相关问题更多 >

编程相关推荐

热门问题

热门文章