擅长:python、mysql、java
<p>这取决于从页面上删除的数据的确切外观。事实上,在清理过程中最大的困难是数据卫生,这也是您在这里所做的</p>
<p>获取元素的方法是正确的,只需进入chrome开发者工具,检查要刮取的元素,并复制元素的xpath</p>
<p>如果您正在刮取的元素只是一个包含多个值的字符串(我认为这不太可能,您试图获取的值很可能在单独的元素中,但是您可以刮取一个包含所有值的div,仍然使用<code>.text()</code>,您将得到一个包含值的字符串),那么您可以使用<code>.split()</code>在结果字符串上,它将被空格分割</p>
<p>然后,结合列表理解</p>
<p><code>my_int_array = [int(val) for val in scraped_string.split()]</code></p>
<p>你有一个整数数组</p>
<p>对于您在问题中发布的确切案例,我将刮取整个表,然后使用BeautifulSoup4提取值。
使用selenium获取表的<code>.innerHTML()</code>,然后使用beautifulsoup解析该html数据<a href="https://www.crummy.com/software/BeautifulSoup/bs4/doc/" rel="nofollow noreferrer">BeautifulSoup Documentation</a></p>