如何在pandas中用x轴标签从列中生成直方图?给定以下数据帧: import pandas as pd df = pd.read_json('{"genre":{"0":"Drama","1":"Comedy","2":"Action","3": ...2024-06-26 已阅读: n次
从列表聚合多行我试图从一个列表中聚合多个值,以便在最终结果中不出现重复。你知道吗 我有这个密码: import imdb ia = imdb.IMDb() top250 = ia.get_top250_movies ...2024-06-26 已阅读: n次
如何创建一个函数,允许我获取数据帧的第一行并生成二维元组列表? df100=a[['genres','imdb_score']] df100 genres imdb_score 0 Action|Adv ...2024-06-26 已阅读: n次
删除数据并转换为numpy数组我试图在Movielens 1M数据集上实现基本矩阵分解电影推荐系统。但是我被困在这里了。我想做的是,我需要做的是对数据进行去均值处理(每个用户的意思是进行规范化),并将其从数据帧转换为numpy数组 ...2024-06-26 已阅读: n次
如何使用Pandas实现first()和max()groupby的等价(来自SQL)? 我有一张表,这里有一张年份和电影类型的列表,以及相应的“受欢迎程度”分数。对于给定的(唯一的)年份,每个流派都有多个分数。你知道吗 我想得到的类型与最高的人气得分为每年,也就是说,只是一个给定的年度 ...2024-06-26 已阅读: n次
使用窗口函数的pyspark我有一个数据帧,其中包含的行表示用户对特定电影的分级实例。每个电影可以由多个用户在多个类别中进行分级。这是我用电影镜头数据创建的结果数据帧。你知道吗 |movie_id|year|categorie ...2024-06-26 已阅读: n次
如何创建过滤列中指定条件的函数?这是我的数据集 我的任务是编写一个函数,过滤掉超过某个值的电影。 函数应该有两个输入参数:表和指定的运行时间。在一个新的表格中,我只能包括两小时或更短的电影,并按票房总额降序排列。然后我需要在屏幕上打 ...2024-06-26 已阅读: n次
Pandas:如果字符串在多个列中的任何一列中至少存在一次,则求和计数,并将此计数添加到具有搜索项的另一个dataframe中我已经在这里问过一次这个问题,但我想澄清一下:Pandas: I want to sum a count if a string exists in any one of several column ...2024-06-26 已阅读: n次
Sorted()排序不正确我正在使用的代码有一个列表,其中包含(moviename、year released、genre、watched或unwatched)。我试图按发布的年份对列表进行排序,但排序不正确 movielis ...2024-06-26 已阅读: n次
从dataframe列将类型提取到列表中我有一个dataframe看起来像这样- id genres 1 [{'id': 35, 'name': 'Comedy'}] 2 [{'id': 35, 'name': 'Comedy'} ...2024-06-26 已阅读: n次
重塑Python列表并保持顺序如果我有一个形状如下的python列表: T = [ ['07,07,2012 22:10', ['people','drama','melody','bun']], ['08,07,2012 21: ...2024-06-26 已阅读: n次
字符串操作,然后对其应用伪变量我正在做一个小项目来建立一个推荐系统。我有电影的分类栏,我想应用虚拟变量 #Here is my data movie_data.head() Customer MovieID Movie_ti ...2024-06-26 已阅读: n次