擅长:python、mysql、java
<p>这就是<a href="http://doc.scrapy.org/en/latest/topics/selectors.html#scrapy.selector.Selector.re">^{<cd1>}</a>方法可以帮助的地方。在</p>
<p>其思想是通过<code>xpath()</code>定位<code>script</code>标记,并使用<code>re()</code>从<code>script</code>标签的内容中提取{<cd5>}和{<cd6>}。来自<a href="http://doc.scrapy.org/en/latest/topics/shell.html">^{<cd8>}</a>的演示:</p>
<pre><code>$ scrapy shell index.html
>>> response.xpath('//script').re(r'new google\.maps\.LatLng\(([0-9.]+),([0-9.]+)\);')
[u'43.2640611', u'2.9388228']
</code></pre>
<p>其中<code>index.html</code>包含:</p>
^{pr2}$
<p><sub>当然,在您的例子中,xpath不只是<code>//script</code>。</sub></p>
<p>仅供参考,<code>new google\.maps\.LatLng\(([0-9.]+),([0-9.]+)\);</code>正则表达式使用<a href="http://www.regular-expressions.info/brackets.html">saving groups</a><code>([0-9.]+)</code>来提取坐标值。在</p>
<p>另请参见<a href="http://doc.scrapy.org/en/latest/topics/selectors.html#using-selectors-with-regular-expressions">Using selectors with regular expressions</a>。在</p>