在pandas datafram中将类转换为数值

2024-05-21 12:35:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个基于这个Kaggle数据集的项目:https://www.kaggle.com/rush4ratio/video-game-sales-with-ratings/data,我需要将数据放入kNN模型中,但是在当前状态下不能这样做,因为我需要将字符串值转换为整数。在

get_dummies并不理想,因为数据集中有大量的分类数据,并且会创建数千列。我正在寻找将字符串转换为数字表示的方法,例如:

Platform || Critic_Score || Publisher || Global_Sales
Wii      ||      73      ||  Nintendo ||  53
Wii      ||      86      ||  Nintendo ||  60
PC       ||      80      ||Activision ||  30
PS3      ||      74      ||Activision ||  35
Xbox360  ||      81      ||   2K      ||  38

我想转变成这样:

^{pr2}$

我用的是python3。在

谢谢。在


Tags: 数据项目字符串httpscomgamewwwvideo
1条回答
网友
1楼 · 发布于 2024-05-21 12:35:44

我想你需要^{}

df['Platform'] = pd.factorize(df['Platform'])[0] + 1
df['Publisher'] = pd.factorize(df['Publisher'])[0] + 1
print (df)
   Platform  Critic_Score  Publisher  Global_Sales
0         1            73          1            53
1         1            86          1            60
2         2            80          2            30
3         3            74          2            35
4         4            81          3            38

^{pr2}$

相关问题 更多 >