2024-09-29 23:20:30 发布
网友
看看Kaggel的Job Salary Prediction,我看到了数字特征(比如Category)和文本特征(比如FullDescription)。在
我如何对这些数据进行培训?我考虑过使用TfidfTransformer对文本进行矢量化,但是它创建了稀疏矩阵,许多学习算法(如RandomForestRegressor)都拒绝使用它。另外,一旦我有了文本的特征向量,如何将其与其他特征相结合?在
关于如何处理这些数据有什么建议吗?在
谢谢!在
我将首先独立学习每个文本字段的tf-idf特性的线性模型,并将线性模型预测作为附加特性添加到其他特性中,并训练组合特征的ExtraTreesRegressor或{}。在
ExtraTreesRegressor
我将首先独立学习每个文本字段的tf-idf特性的线性模型,并将线性模型预测作为附加特性添加到其他特性中,并训练组合特征的}。在
ExtraTreesRegressor
或{相关问题 更多 >
编程相关推荐