Python中文
首页
教程
问答
标签
搜索
登录
注册
大数据集分类模型
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我想在一个数据集上实现一个分类模型,其中n=3000000,有12列。我有一个问题,因为下班后速度很慢,我什么也看不到,你有没有建议把它开快一点</p> <p>塔克斯</p> <pre><code>df = pd.DataFrame(np.random.randint(0,100,size=(3000000, 12)), columns=list('ABCDEFGHIJKL')) X=df.drop(['L'], axis=1) y=df['L'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2) parameters = {'n_neighbors':np.arange(1,30)} grid=GridSearchCV(KNeighborsClassifier(),parameters,cv=5) grid.fit(X_train, y_train) </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>除了减少大量邻居之外,另一个答案是:从较小的数据样本构建模型。如果<code>KNeighborsClassifier</code>在一百万次观测中看起来不太有希望,那么花时间和资源在三百万次观测中进行试验可能是不值得的</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
8 回答
无法使用Django\u mssql\u后端迁移到外部hos
2 回答
无法使用Django&Python3.4连接到MySql
4 回答
无法使用Django+nginx上载媒体文件
9 回答
无法使用Django1.6导入名称模式
5 回答
无法使用Django1.7和mongodb登录管理站点
4 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
3 回答
无法使用Djangockedi验证CBV中的字段
8 回答
无法使用Djangocketditor上载图像(错误400)
8 回答
无法使用Djangocron进行函数调用
5 回答
无法使用Djangofiler djang上载文件
1 回答
无法使用Djangokronos
1 回答
无法使用Djangomssql provid
7 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
2 回答
无法使用Djangomssq迁移Django数据库
1 回答
无法使用Djangonox创建用户
9 回答
无法使用Djangopyodb从Django查询SQL Server
9 回答
无法使用Djangopython3ldap连接到ldap
9 回答
无法使用Djangoredis连接到redis
9 回答
无法使用Django中的FK创建新表
8 回答