比较字符串与修改的字符串和部分字符串

2024-10-03 02:41:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个链接列表,我想看看它们是否列在我的否认文件中。你知道吗

我的拒绝文件既包含url(例如http://getpaydayloan.org/blog/blog-how-to-apply-for-online-payday-loans-san),也包含整个域,列为domain:getpaydayloan.org。你知道吗

新的url文件只保存url,例如http://getpaydayloan.org/blog/blog-how-to-apply-for-online-payday-loans-san

我想看看新的网址是否已经在否认文件中。我当前正在使用diff = set(url_set)-set(disavow_urls)生成一个diff,但是我还需要检查它们是否在使用domain:url.com格式的否认文件中。你知道吗

我该怎么做那样的事?你知道吗

如果有帮助,下面是整个脚本:https://github.com/growth-austen/disavow_automator


Tags: 文件toorghttpurlforbloghow
2条回答

大卫的娱乐功能的一些替代定义:

return any(domain in url for domain in disavowDomainList) return any(map(url.__contains__, disavowDomainList))

(为了提高内存效率,在python2中用itertools.imap替换map

下面是一个函数,用于检查url是否包含任何被拒绝的域。你知道吗

def inDisavow(url, disavowDomainList):
    for domain in disavowDomainList:
        if domain in url:
            return true
    return false

相关问题 更多 >