tex的感知哈希函数

2024-10-02 04:30:02 发布

您现在位置:Python中文网/ 问答频道 /正文

有人知道一个简单的文本感知哈希算法吗?我查看了pHash函数ph_texthash,但我想要一个更简单的算法。 最好是Python。谢谢您!在


Tags: 函数文本算法phphashtexthash
1条回答
网友
1楼 · 发布于 2024-10-02 04:30:02

关于感知哈希函数的博客文章(在图像上下文中):

以及一些相关的python代码(处理图像,而不是文本,但可能是可调整的):


正如我所理解的关于Perceptual Hashing of Textual Content的简短陈述,有许多方法(在不同的维度,如文本的层次、语言或统计方法、选择来表示文本的模型,…),正确的方法将取决于您的领域和您试图解决的问题。在

您还可以查看Locality-sensitive hashing,其中

is a method of performing probabilistic dimension reduction of high-dimensional data. The basic idea is to hash the input items so that similar items are mapped to the same buckets with high probability (the number of buckets being much smaller than the universe of possible input items)

相关问题 更多 >

    热门问题