用漂亮的python节点替换Soup中的python字符串

2024-07-04 17:08:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我必须下载和保存网页与给定的网址。我已经下载了页面以及所需的js和css文件。但问题是更改html源文件中这些标记的src和href值,以使其正常工作。在

我的html源代码是:

<link REL="shortcut icon" href="/commd/favicon.ico">
<script src="/commd/jquery.min.js"></script>
<script src="/commd/jquery-ui.min.js"></script>
<script src="/commd/slimScroll.min.js"></script>
<script src="/commd/ajaxstuff.js"></script>
<script src="/commd/jquery.nivo.slider.pack.js"></script>FCT0505
<script src="/commd/jquery.nivo.slider.pack.js"></script>
<link rel="stylesheet" type="text/css" href="/fonts/stylesheet.cssFCT0505"/>
<link rel="stylesheet" type="text/css" href="/commd/stylesheet.css"/>
<!--[if gte IE 6]>
<link rel="stylesheet" type="text/css" href="/commd/stylesheetIE.css" />
<![endif]-->
<link rel="stylesheet" type="text/css" href="/commd/accordion.css"/>
<link rel="stylesheet" href="/commd/nivo.css" type="text/css" media="screen" />
<link rel="stylesheet" href="/commd/nivo-slider.css" type="text/css" media="screen" />

我找到了css和js文件的所有链接,并使用以下工具下载了它们:

^{pr2}$

有谁能给我一个在循环执行过程中改变src/href文本的方法吗。 这是我爬行的第一个任务。在


Tags: textsrctypejslinkscriptjquerymin
1条回答
网友
1楼 · 发布于 2024-07-04 17:08:00

documentation读取:

You can add, remove, and modify a tag’s attributes. Again, this is done by treating the tag as a dictionary:

所以写一些东西,比如:

l["src"] = os.path.join(os.getcwd(),foldername, file)

而不是

^{pr2}$

我相信会成功的

相关问题 更多 >

    热门问题