我有一个链接列表,我想看看它们是否列在我的否认文件中。你知道吗
我的拒绝文件既包含url(例如http://getpaydayloan.org/blog/blog-how-to-apply-for-online-payday-loans-san
),也包含整个域,列为domain:getpaydayloan.org
。你知道吗
新的url文件只保存url,例如http://getpaydayloan.org/blog/blog-how-to-apply-for-online-payday-loans-san
我想看看新的网址是否已经在否认文件中。我当前正在使用diff = set(url_set)-set(disavow_urls)
生成一个diff,但是我还需要检查它们是否在使用domain:url.com
格式的否认文件中。你知道吗
我该怎么做那样的事?你知道吗
如果有帮助,下面是整个脚本:https://github.com/growth-austen/disavow_automator
大卫的娱乐功能的一些替代定义:
return any(domain in url for domain in disavowDomainList) return any(map(url.__contains__, disavowDomainList))
(为了提高内存效率,在python2中用
itertools.imap
替换map
)下面是一个函数,用于检查url是否包含任何被拒绝的域。你知道吗
相关问题 更多 >
编程相关推荐