在不计算全部距离的情况下,得到具有最大多样性的子集

2024-09-30 22:14:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我读了关于top-k算法的幻灯片,这些算法是费金算法(Fagin Algorithm,FA)、门限算法(Threshold Algorithm,TA)和无随机存取算法(No random access Algorithm,NRA)。这些算法是好的,因为我们不需要看到所有的值,我们只需要设置一个阈值或计算下限和上限。你知道吗

幻灯片=http://alumni.cs.ucr.edu/~skulhari/Top-k-Query.pdf

现在,我有大量的数据点,我想得到的顶k点(子集)的多样性最大,这意味着顶k点(子集)之间的距离最大。我知道这个问题是NP难的。在这种情况下,由于数据量大,暴力等算法是不可行的。你知道吗

在这里,我只想知道,有没有可能像FA/TA/NRA算法那样,不计算所有对点之间的所有距离就得到子集/顶k点?你知道吗


Tags: no算法距离thresholdtoprandomalgorithm子集