大数据集分类模型

df = pd.DataFrame(np.random.randint(0,100,size=(3000000, 12)), columns=list('ABCDEFGHIJKL')) X=df.drop(['L'], axis=1) y=df['L'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2) parameters = {'n_neighbors':np.arange(1,30)} grid=GridSearchCV(KNeighborsClassifier(),parameters,cv=5) grid.fit(X_train, y_train)

2条回答

网友

1楼 · 编辑于 2024-09-28 16:19:12

除了减少大量邻居之外，另一个答案是：从较小的数据样本构建模型。如果KNeighborsClassifier在一百万次观测中看起来不太有希望，那么花时间和资源在三百万次观测中进行试验可能是不值得的

网友

2楼 · 编辑于 2024-09-28 16:19:12

使用更多的核心，即在GridSearchCV和KNeighborsClassifier中使用n_jobs=-1

parameters = {'n_neighbors':np.arange(1,30)}
grid=GridSearchCV(KNeighborsClassifier(n_jobs=-1),parameters,cv=5, n_jobs=-1)
grid.fit(X_train, y_train)

编程相关推荐

Spring、JPA和hibernate的java问题
如何将JMC（Java任务控制）连接到ubuntu中的远程JVM？
java如何将eventListener的结果存储为对象？
java在安卓中，点击一个按钮，我如何停止发送循环中发送的消息
java打开活动中的电子邮件
使用velocity模板打印JasperReports
java无法在自定义信息窗口上拨号
java如何在jsonb postgresql中查询并转换为谓词JPA
java更好地理解J2EE环境中的异常和日志记录
java打印多个文件

相关问题更多 >

编程相关推荐

热门问题

热门文章