擅长:python、mysql、java
<p><em>假设数据id在div</em></p>
<p>BeautifulSoup.find将找到的html元素作为字典返回给您。因此,您可以使用标准方法来导航它,以访问文本(正如您在问题中所做的)以及html标记(如下面的代码所示)</p>
<pre><code>soup = BeautifulSoup('<div class="_article" data-id="qe67234">')
soup.find("div", {"class":"_article"})['data-id']
</code></pre>
<p>请注意,通常情况下,视频元素需要JS来播放,如果使用非javascript客户机(即python<code>requests</code>)对其进行刮取,则可能无法找到必需的元素</p>
<p>如果发生这种情况,您必须使用<code>phantomjs + selenium</code>browser之类的工具将网站与javascript结合起来,以执行抓取</p>
<p><strong>编辑
如果<code>data-id</code>标记本身不是常量,则应该查看<code>lxml</code>库以替换<code>BeautifulSoup</code>,并使用<code>xpath</code>值来查找所需的元素</p>