搜索列表python的最佳主题搜索算法

2024-10-01 17:32:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我想做一个程序,自定义广告的基础上,你的搜索历史。你知道吗

因此,我需要一个算法/脚本,找到广告的最佳关键字,将调整到特定的人,在搜索频率和时间的基础上,从搜索的话经过。你知道吗

例如

如果我的搜索列表是:

  1. 如何找到句子的主词-2018-03-31 15:16:04.752350

  2. 句子主词-python-2018-03-28 15:16:04.752350

  3. 狗食-2016年3月28日15:16:04.752350

  4. 狗和它们的食物-2016年3月25日15:16:04.752350
  5. 狗粮-2016年3月23日15:16:04.752350

所以,即使狗,食物是一个3倍,句子的主词只有2,由于事实上,随着时间的推移,因为用户搜索狗的食物,将选择的主题是-主词的句子。你知道吗

到目前为止,我已经做了一些算法,找到了句子的主要主题,而没有对经过的时间进行排序。但是,正如我所说,我需要一个基于时间的算法。我吹捧一些简单的想法,比如最近用常数搜索“好”的分数,但我想要更好的算法。你知道吗

多谢了

奥马尔


Tags: 程序脚本算法主题列表时间关键字历史
1条回答
网友
1楼 · 发布于 2024-10-01 17:32:10

你可以计算每个单词的频率,对较老的单词会有一些惩罚。你知道吗

  • 例如,如果上个月出现了一个单词,那么它就算作 "1".

  • 如果超过一个月,但又快过一年,那就算了 “0.5”

  • 如果超过一年,则计算为“0.1”

这是一个简化,但你可以用这个想法把更多的重点放在最近的话。你知道吗

稍微提高一点就可以使用“正态分布”。下面是一个绘制正态分布的好例子:python pylab plot normal distribution

在您的例子中,您不需要在图形上绘制它,而是希望用y轴值乘以频率。你知道吗

相关问题 更多 >

    热门问题