传递了稀疏矩阵，但需要密集数据。使用X.toarray（）转换为密集的numpy数组

dataset = load_files('train') vectorizer = TfidfVectorizer(encoding='latin1') X_train = vectorizer.fit_transform((open(f).read() for f in dataset.filenames)) assert sp.issparse(X_train) print("n_samples: %d, n_features: %d" % X_train.shape) y_train = dataset.target def benchmark(clf_class, params, name): clf = clf_class(**params).fit(X_train, y_train)

2条回答

网友

1楼 · 编辑于 2024-10-05 14:27:22

我遇到了同样的问题，试图使用load_svmlight_files加载的数据来训练GradientBoostingClassifier。通过将稀疏矩阵转换为numpy数组来求解。

X_train.todense()

网友

2楼 · 编辑于 2024-10-05 14:27:22

因为sklearn中的GBRT请求X（训练数据）是array-like而不是sparse matrix：sklearn-gbrt

我希望这能帮助你！

编程相关推荐

java如何将元素从一个ArrayList添加到另一个ArrayList？
oop java中的setter和getter有什么意义？
java如何在循环中添加用户输入？
java在没有maven jetty的情况下从命令行运行war
数组@override to。字符串仅打印出默认构造函数java hw
java获取mysql中两天之间的天数名称
java如何使用属性值从一个方法到另一个方法
java如何在MULE中进入流程中间，并将消息返回给客户端。。？
java有没有办法将EncryptedSharedReference与PreferenceScreen集成？
java在shell脚本中嵌入可执行二进制文件

相关问题更多 >

编程相关推荐

热门问题

热门文章