我读了关于top-k算法的幻灯片,这些算法是费金算法(Fagin Algorithm,FA)、门限算法(Threshold Algorithm,TA)和无随机存取算法(No random access Algorithm,NRA)。这些算法是好的,因为我们不需要看到所有的值,我们只需要设置一个阈值或计算下限和上限。你知道吗
幻灯片=http://alumni.cs.ucr.edu/~skulhari/Top-k-Query.pdf
现在,我有大量的数据点,我想得到的顶k点(子集)的多样性最大,这意味着顶k点(子集)之间的距离最大。我知道这个问题是NP难的。在这种情况下,由于数据量大,暴力等算法是不可行的。你知道吗
在这里,我只想知道,有没有可能像FA/TA/NRA算法那样,不计算所有对点之间的所有距离就得到子集/顶k点?你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐