我已经从https://figshare.com/articles/On_screen_movie_kill_counts_for_hundreds_of_films/889719加载了一个csv“Body Count dataset”作为数据帧到我的jupyter笔记本中。
我的任务是做线性回归,以预测电影MPAA评级。我听说,我的数据向量X应该包含以下列:Body\u Count、IsAction、IsThriller等等…
不幸的是,我不知道如何从我的数据集中获得这些统计数据,因为每一种电影类型都被贴上了“惊悚动作剧”的标签。
你知道怎么做吗?你知道吗
签出pandas.get_dummies
你可以用
为各种流派类型创建新列。然后将其与您的数据结合起来,并将
pd.get_dummies()
与.sum()
一起使用:要从
index
中删除Film
和Body_Count
,请使用相关问题 更多 >
编程相关推荐