如何处理文本和数字特征的组合?

2024-09-29 23:20:30 发布

您现在位置:Python中文网/ 问答频道 /正文

看看Kaggel的Job Salary Prediction,我看到了数字特征(比如Category)和文本特征(比如FullDescription)。在

我如何对这些数据进行培训?我考虑过使用TfidfTransformer对文本进行矢量化,但是它创建了稀疏矩阵,许多学习算法(如RandomForestRegressor)都拒绝使用它。另外,一旦我有了文本的特征向量,如何将其与其他特征相结合?在

关于如何处理这些数据有什么建议吗?在

谢谢!在


Tags: 数据文本算法job矩阵数字特征矢量化

热门问题