如何从该页面获取真实内容: http://kursuskatalog.au.dk/da/course/74960/105E17-Demokrati-og-diktatur-i-komparativt-perspektiv
我从下面的代码中得到的只是一些指向javascript和CSS文件的链接。有办法摆脱这个吗?在
from urllib.request import urlopen
html = urlopen("http://kursuskatalog.au.dk/da/course/74960/105E17-Demokrati-og-diktatur-i-komparativt-perspektiv")
print(html.read())
谨致问候,克雷斯滕
此URL中的内容是在页面加载后使用JavaScript创建的。在
印刷的是“真实”的内容。如果您想看到JavaScript代码的输出,您需要通过
<script></script>
标记和外部脚本获取所有JavaScript,然后使用JavaScript Parser来读取它。您不需要CSS脚本来读取内容,因为它们只是用来设置页面的样式。在不幸的是我想不出别的办法。在
我希望我能帮上忙。在
相关问题 更多 >
编程相关推荐