Python从明文中筛选URL并打印筛选结果

urls = ["https://www.facebook.com/SomeCompany", "https://example.com/news/", "https://twitter/test"] urls = list(dict.fromkeys(urls)) listfile = open("list.txt", 'r') filtered = [] for url in list(set(urls)): for line in listfile: if url in line : urls.remove(url) else: filtered.append(url) print(' - '.format(filtered))

2条回答

网友

1楼 · 编辑于 2024-09-21 01:19:02

你可以试试这个

您可以使用any()检查列表中是否有行

urls = ["https://www.facebook.com/SomeCompany", "https://example.com/news/", "https://twitter/test"]
var = "https://www.facebook.com/"
if any (var in u for u in urls):
    print(var)

网友

2楼 · 编辑于 2024-09-21 01:19:02

要从url提取主机名，可以使用urllib执行以下操作：

from urllib.parse import urlparse
parsed_uri = urlparse('http://stackoverflow.com/questions/xy' )
result = '{uri.scheme}://{uri.netloc}/'.format(uri=parsed_uri)
print(result)

# outputs
'http://stackoverflow.com/'

编程相关推荐

使用freemarker（ftl模板）通过spring发送outlook电子邮件的java自定义表单
java Project Euler 17错误答案
java想澄清所有关于Android多屏幕尺寸支持的疑问吗？
如何使用Eclipse和Maven配置Java项目以连接到AmazonRDS
java如何在Java8中按流对映射对象按时间段求和？
我是Java新手，希望有人能帮我
java Spring boot，序列化和反序列化时Jackson Json问题
java扫雷器（不是算法，只是布局问题）
java找到一个字符[]的完全唯一排列吗？
java哪种CRC用于更改Desfire卡中的密钥

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python从明文中筛选URL并打印筛选结果

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >