如何在spotify上查找曲目的原始发布日期(而不是重新发布日期)?

2024-10-03 11:24:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在与Spotify合作一个个人项目,在那里我基本上找到了与输入歌曲最相似的歌曲。基本上,我已经在Spotify上创建了一个庞大的曲目数据集(大约55万首曲目),包括所有的元数据和“歌曲特性”

这个数据集有track name/URI、artist name/URI、album name/URI、release year和Spotify计算的track属性,比如danceability或acousticness等。这个数据集在本地存储为CSV,但是我当然可以很容易地将它转换成dataframe或numpy数组

在我的程序中,数据集中发布年份的准确性非常重要,因为这是确定歌曲相似性的重要特征之一,我发现

目前,我正在使用spotifyapi专辑发行日期来提取歌曲发行的年份。它工作得非常好,但是这个方法有一个问题:重新发行专辑/曲目

对于许多老艺术家(我的数据集的很大一部分),他们会在1971年发行一首歌,然后同一首歌会出现在2015年重新发行的专辑中。虽然这两首歌是相同的,但他们有不同的Spotify URI,不同的专辑名/ID,而且常常歌曲的名字也不一样(比如“天梯”和“天梯-2012翻唱者”),因此,很难说它们是重复的歌曲,在我的数据集中重新发布的歌曲年份是2012年,而不是1971年

基本上,如果用户输入了一首2012年的歌曲,我希望找到该时间段的类似歌曲,而不是伪装成2012年歌曲的1971首歌曲

你知道有没有办法:

A)使用我在第二段中描述的功能,在我的数据集中高效地找到重复的曲目(55万首歌曲)

或者

B)一个API,它会告诉你一首歌的原始发行日期,而不是重新发行的发行日期

谢谢你的帮助


Tags: 数据项目namealbumartisttrack特性uri