比较HTML与difflib

url = 'https://secure.ssa.gov/apps10/reference.nsf/instructiontypecode!openview&restricttocategory=POMT' response = urllib.urlopen(url content = response.read() import difflib d = difflib.Differ() diffed = d.compare(content, content)

1条回答

网友

1楼 · 发布于 2024-10-02 00:26:06

^{}的参数应该是字符串序列。如果使用两个字符串，它们将被视为序列，因此逐个字符进行比较。在

所以你的例子应该改写为：

url = 'https://secure.ssa.gov/apps10/reference.nsf/instructiontypecode!openview&restricttocategory=POMT'
response = urllib.urlopen(url)
content = response.readlines()  # get response as list of lines
import difflib
d = difflib.Differ()

diffed = d.compare(content, content)
print('\n'.join(diffed))

如果您只想比较html文件的内容，您可能应该使用解析器来处理它，并且只获取不带标记的文本，例如使用beauthulsoup的soup.stripped_strings：

^{pr2}$

编程相关推荐

Java+Brave+Zipkin：问题是，跟踪总是一样的
swing能否取消Java中的特定TimerTask？
java以编程方式重新运行失败的TestNG测试
java DefaultMessageListenerContainer未从IBM MQ读取消息
使循环结果显示在一个数组到一个数组中。Java中的toString
tomcat java。lang.NoClassDefFoundError在对GlassFish/Payara部署战争时出错
Java中的增量算法
Java中lambda类的类名是什么意思？
java图像url无法加载安卓 Imageview实际图像为“PNG”格式
java如何使用JPA使库对象数据库持久化？

相关问题更多 >

编程相关推荐

热门问题

热门文章

比较HTML与difflib

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >