PaCMAP的正式实现:成对控制流形逼近投影
pacmap的Python项目详细描述
太平洋地图
PaCMAP(Pairwise Controlled Manifold Approximation)是一种可用于可视化的降维方法,它既保留了原始空间中数据的局部结构,又保留了数据的全局结构。PaCMAP使用三种点对优化低维嵌入,即相邻对(pair-near-neighbors)、中近对(pair-near-pair-MN)和进一步对(pair-_-FP),其数目分别为n_-neighbors、n-MN和n_-FP。在
以往的降维技术主要关注局部结构(如t-SNE、LargeVis和UMAP)或全局结构(如TriMAP),但不是两者都关注,尽管在算法中仔细调整控制全局和局部结构之间的平衡的参数,这主要是调整考虑的邻域的数量。PaCMAP动态地使用一组特殊的对(mid-near-pairs)来捕捉全局结构,然后细化局部结构,这既保留了全局结构,又保留了局部结构。在
安装
要求:
- numpy公司
- 学习
- 惹恼
- 麻木
要安装PaCMAP,可以使用pip:
pip install pacmap
基准
以下图像是两个数据集的可视化视图:MNIST和{a2},由PaCMAP生成。两个可视化结果分别展示了PaCMAP局部结构和全局结构的保存能力。在
参数
最重要的参数列表如下所示。更改这些值将显著影响降维的结果。在
- 在
n_邻居:n_neighbors控制k-最近邻居图中考虑的邻居数量
在 - 在
MN_比率:中-近对数与邻居数的比率,n_MN=$\lfloor$n_neighbors*MN_ratio$\rfloor$
在 - 在
FP_ratio:进一步对数与邻居数的比率,n_FP=$\lfloor$n_neighbors*FP_ratio$\rfloor$
在
复制实验
为了更好地运行代码,我们提供了可重复性的代码。代码分为三个部分,分别位于三个文件夹中:
data
,其中包括我们使用的所有数据集,预处理为每个DR方法使用的文件格式experiments
,其中包括我们用来生成DR结果的所有脚本evaluation
,其中包括我们用来评估DR结果的所有脚本,在本文的第8节中有说明
下载代码后,您可能需要指定存储在脚本中的位置,以使它们完全正常工作。在
引文
如果您在出版物中使用PaCMAP,或者您使用了此存储库中的实现,请在此处引用我们的预印本:
^{pr2}$许可证
请参阅许可证文件。在
- 项目
标签: