azureml中特征提取的tfidvctorizer和次线性缩放

2024-09-30 08:16:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在研究ML文档分类问题。有人知道如何在azureml中进行n-gram Tfidf特征提取和次线性缩放吗

在过去,我使用TfidfVectorizer(参见下面的示例)学习inSci工具包,但问题是,在AzureML中,我不能使用python模块显式地定义自己的方法或类,而宁愿不上传压缩代码。在

我是一个python人,但是如果有一个等价的R,我愿意使用它。市场上有一个R样本,但它依赖于unigram。在

TfidfVectorizer(max_df=.67,min_df=.015,lowercase=False ,sublinear_tf=True,norm='l2',tokenizer=AbstractTokenizer())

最好的, -阿里


Tags: 模块文档示例df工具包定义分类线性
1条回答
网友
1楼 · 发布于 2024-09-30 08:16:40

欢迎使用AzureML。在

对于定义自己的方法的问题,AzureML是一种用于ML建模的基于流的可视化编程工具。它不同于在本地主机上编程。您可以为不同的数据集进程定义模块,并通过在两个模块之间链接的拖放线来链接它们。ML Stduio上有一个现有模块的列表,请参阅https://msdn.microsoft.com/en-us/library/azure/dn906033.aspx。您只需要将它们组合起来,就可以创建自己的ML模型。在

对于使用Python模块的问题,AzureML上的Python有一些限制。不能对Python安装进行组合,请参阅https://azure.microsoft.com/en-us/documentation/articles/machine-learning-execute-python-scripts/#limitations的第4项。在

但是,对于R语言,可以导入尚未安装在mlstudio中的包。请参考https://azure.microsoft.com/en-us/documentation/articles/machine-learning-extend-your-experiment-with-r/#importing-packages。在

同时,您还可以在AzureML中编写自定义R模块。请参考https://azure.microsoft.com/en-us/documentation/articles/machine-learning-extend-your-experiment-with-r/#importing-packages。在

所以我认为您可以通过在API install.packages('<pkgs.zip>', ...)上安装依赖项“unigrams”来运行R示例。在

谨致问候。在

相关问题 更多 >

    热门问题