如何清理使用Django的网站

1条回答

网友
1楼 · 发布于 2024-05-20 17:10:39

这应该适用于您想要的：
import requests from bs4 import BeautifulSoup r = requests.get('https://1xxpers100.mobi/en/line/') soup = BeautifulSoup(r.content, 'lxml') print(soup.encode("utf-8"))
这里'lmxl'是我使用的，因为它适用于我测试它的站点。如果您在这方面有问题，请尝试另一个解析器
另一个问题是，有一个默认情况下无法识别的字符。因此，使用utf-8阅读soup的内容
额外信息
这与django无关。HTML具有所谓的“树”状结构。其中，每组标记都是其内部所有子标记的父标记。你只是在树上读得不够深

编程相关推荐

java RFID不完整输出？
java如何构造一个for循环来查找每个数组的第一个索引的总和
java Eclipse AST解析器正在删除我的规则
安卓如何在java中创建“可重写”配置？
java每次我向应用程序添加图像时，它都会崩溃
Java 8流到文件
EntityNotFoundException的java可能原因
java多线程为什么下面的程序表现得如此怪异？
java footprint soap api+mavenjaxb2plugin
java MongoDB锁定，直到找到结果

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何清理使用Django的网站

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >