去掉一个分类特征的编码

loo_encoder的Python项目详细描述


去掉一个编码器

为分类功能保留一个代码

请在此处查看此项目的源: https://github.com/welfare520/leave-one-out-encoder

开始

安装

$ pip install loo_encoder

示例

根据X和y安装编码器,然后对其进行变换

fromloo_encoder.encoderimportLeaveOneOutEncoderimportpandasaspdimportnumpyasnpenc=LeaveOneOutEncoder(cols=['gender','country'],handle_unknown='impute',sigma=0.02,random_state=42)X=pd.DataFrame({"gender":["male","male","female","male"],"country":["Germany","USA","USA","UK"],"clicks":[10,33,47,21]})y=pd.Series([150,250,300,100],name="orders")df_train=enc.fit_transform(X=X,y=y,sample_weight=X['clicks'])

执行到新分类数据的转换。

X_val=pd.DataFrame({"gender":["unknown","male","female","male"],"country":["Germany","USA","Germany","Japan"]})df_test=enc.transform(X=X_val)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java解析一个文本文件,如果内容是一种特定的格式,就打印它   java如何使jbutton在另一个组件中执行键盘笔划   连接到独立帐户的java Stripe   java在数据库连接过程中出错。。。初始连接   一个系列JavaFX中特定节点的java集样式   java重建recycler视图会导致它消失   在codechef上提交java Getting runtime(NZEC)时出错   Java类路径设置错误   java如何显示数组中2个数字之间的信息?   java为什么新的GC只有很长的用户时间?   如何解决java。关于此代码的lang.OutOfMemoryError   通过应用程序在Facebook粉丝页面上发布java帖子   java Red5服务器无法启动   系统输出Java读取文本文件外置行   java整数。Parse对excel获取的字符串抛出NumberFormatException   有一个Java数组列表;如何按每个数组的最后一个元素排序?   java需要txt文件中的数据(以逗号分隔)来用现有类中的对象填充arraylist