对urllib隐藏HTML数据

2024-07-04 13:28:54 发布

您现在位置:Python中文网/ 问答频道 /正文

如何从该页面获取真实内容: http://kursuskatalog.au.dk/da/course/74960/105E17-Demokrati-og-diktatur-i-komparativt-perspektiv

我从下面的代码中得到的只是一些指向javascript和CSS文件的链接。有办法摆脱这个吗?在

from urllib.request import urlopen
html = urlopen("http://kursuskatalog.au.dk/da/course/74960/105E17-Demokrati-og-diktatur-i-komparativt-perspektiv")
print(html.read())

谨致问候,克雷斯滕


Tags: http内容html页面daurlopenauog
2条回答

此URL中的内容是在页面加载后使用JavaScript创建的。在

印刷的是“真实”的内容。如果您想看到JavaScript代码的输出,您需要通过<script></script>标记和外部脚本获取所有JavaScript,然后使用JavaScript Parser来读取它。您不需要CSS脚本来读取内容,因为它们只是用来设置页面的样式。在

不幸的是我想不出别的办法。在

我希望我能帮上忙。在

相关问题 更多 >

    热门问题