擅长:python、mysql、java
<p>你将需要在这里搜索到的每一个问题都会用到你的刮卡程序。每个站点的html将以不同的方式组织,您必须剖析这个html来确定每个站点的卡片数据是如何表示的。如果您愿意为每个站点的html编写唯一的代码来搜索特定的卡数据,那么我建议您使用以下方法:</p>
<ul>
<li><p>在phantomjs中使用上面建议的Selenium webdriver(它是无头的,所以速度更快)。在</p>
<ol>
<li>对于可能包含该卡的每个潜在站点,编写一个函数将幻影js驱动程序定向到该站点的url,然后使用FindElement查找搜索栏元素。然后使用SendKeys方法将单个卡的名称发送到搜索栏,然后使用search按钮上的Click方法。在</li>
<li>然后驱动程序将被引导到带有搜索结果的页面。在这里,您将不得不使用诸如chrome开发工具之类的工具来检查页面的html,并确定卡片数据(名称、价格等)是如何显示的。一旦剖析了html,就可以让程序使用FindElement来获取这些数据。将其存储在某种集合中以返回主函数。在</li>
<li>重复这些步骤,为你计划搜索的每个网站编写一个独特的scrape函数。在</li>
<li>从您的主函数中,调用上面的每个scrape函数,并比较每个函数的结果以找到最佳价格。在</li>
</ol></li>
</ul>
<p>这是一个非常高层次的解释,但是如果您了解python或c#等语言的基础知识,那么自学selenium和phantomjs就很容易了,而且实现起来也相当容易。在</p>