使用google自定义搜索引擎的Python字数统计

2024-10-01 11:29:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用python通过一个定制的google引擎进行搜索。我可以使用results[“searchInformation”][“totalResults”]找到搜索结果的总数。如何计算某个特定单词在搜索中出现的次数?你知道吗


Tags: 引擎google单词次数results总数totalresultssearchinformation
1条回答
网友
1楼 · 发布于 2024-10-01 11:29:22

通过调查API在搜索后返回的参数,我在可访问字段中没有发现任何类似于自动字数统计的内容。不过,我找到了一个可能适合您的解决方法;您可以从结果转储文件中手动执行字数计数例程。你知道吗

由于该文件受您可以搜索的最大页数的限制,我建议您使用适合您的最大页数(我的是11页,根据搜索的不同而有所不同)。你知道吗

如果将这些结果转储到json文件中,则可以执行以下代码进行字数计算(它在linux shell中,不过也可以用python实现):

cat data.json | tr -s "," "\n" | grep -e "title" -e "snippet" | grep -c '<your word>'

其中:

  • '数据.json':是包含API搜索结果的转储文件。你知道吗
  • “tr-s”,“”\n“':对列出的每一行进行行分隔。你知道吗
  • 'grep-e“title”-e“snippet”':仅用“title”或“snippet”筛选行(结果的标题和描述,不含元数据)
  • 'grep-c''':对引入的单词进行计数

相关问题 更多 >