<p>在“开发工具打开”页面上单击任何链接后,在“网络”下的“文档”选项卡下:</p>
<p><a href="https://i.stack.imgur.com/orZHr.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/orZHr.png" alt="enter image description here"/></a></p>
<p>您可以看到三个链接,第一个链接是我们单击的内容,第二个链接返回允许您跳转到特定<em>文章</em>的html,最后一个链接包含文章文本。在</p>
<p>在firstlink返回的源代码中,可以看到两个<em>iframe</em>标记:</p>
<pre><code><div id="alberoTesto">
<iframe
src="/atto/caricaAlberoArticoli?atto.dataPubblicazioneGazzetta=2016-08-31&atto.codiceRedazionale=16G00182&atto.tipoProvvedimento=DECRETO LEGISLATIVO"
name="leftFrame" scrolling="auto" id="leftFrame" title="leftFrame" height="100%" style="width: 285px; float:left;" frameborder="0">
</iframe>
<iframe
src="/atto/caricaArticoloDefault?atto.dataPubblicazioneGazzetta=2016-08-31&atto.codiceRedazionale=16G00182&atto.tipoProvvedimento=DECRETO LEGISLATIVO"
name="mainFrame" id="mainFrame" title="mainFrame" height="100%" style="width: 800px; float:left;" scrolling="auto" frameborder="0">
</iframe>
</code></pre>
<p>第一个是本文,后者带有<em>/caricarticolodefault</em>和<em>id</em><em>主机</em>就是我们想要的。在</p>
<p>您需要使用来自初始请求的cookies,这样您就可以使用<em>Session</em>对象,并使用<a href="https://www.crummy.com/software/BeautifulSoup/bs4/doc/#find-all-next-and-find-next" rel="nofollow noreferrer">bs4</a>解析页面:</p>
^{pr2}$
<p>第一个文本文件的片段:</p>
^{3}$