我正在使用IMDB数据进行一个个人项目,目前已经用尽了所有途径。在
快速概述:
到目前为止,我已经执行了以下操作:
plt.subplot2grid((2,3),(0,1))
actor_1 = df.pivot_table(index="Actor_1", values="Gross_Earnings", aggfunc='sum').sort_values(ascending=False)
actor_1[:15].sort_values(ascending=True).plot(kind='barh', width=0.7, alpha=0.5, color='red')
ax.tick_params(axis='x', labelsize=60)
ax.tick_params(axis='y', labelsize=60)
plt.xlabel("Gross Earnings")
plt.tight_layout()
plt.show()
这是可行的,但它只返回最高值,而不返回附加条件为>;4个胶片的最高值。在
我也尝试了以下方法:
^{pr2}$但它返回以下错误:“AttributeError:无法访问“SeriesGroupBy”对象的可调用属性“map”,请尝试使用“apply”方法
no_of_films = df.groupby("Actor_1")
name_count_key = df["Actor_1"].value_counts().to_dict()
no_of_films["Films"] = no_of_films["Actor_1"].apply(name_count_key)
但它返回以下错误:“TypeError:unshable type:'dict'”
按函数分组的想法是创建一个名为“Films”的新列,因此计算每个演员主演的电影量,然后使用>;4,但它返回bools而不是实际值。在
Director Actor_1 IMDB_Score Gross_Earnings Movie_Title
Andrew Stanton Daryl Sabara 6.6 73058679 John Carter
Sam Raimi J.K. Simmons 6.2 336530303 Spider-Man 3
Nathan Greno Brad Garrett 7.8 200807262 Tangled
Joss Whedon Chris Hemsworth 7.5 458991599 Avengers: Age of Ultron
这是可能的还是我太傻了?在
任何帮助都将不胜感激。在
谢谢
阿德里安
我想你需要filter或{a2}加{a3}:
或更快的解决方案:
^{pr2}$然后使用^{} 和聚合^{} :
最后一个绘图是^{} :
相关问题 更多 >
编程相关推荐