擅长:python、mysql、java
<p>关于加速你的工作流程,你可能有兴趣看看我的答案的第三部分:<a href="https://stackoverflow.com/a/50457922/5922920">https://stackoverflow.com/a/50457922/5922920</a></p>
<p>如果您想在使用分布式文件系统时保持类似SQL的接口,除了Hadoop</em>和Spark</em>之外,您可能还需要查看<em>Hive</em>、<em>Pig</em>和<em>Sqoop</em>。你知道吗</p>
<p>此外,为了跟踪SQL查询的性能,如果合适的话,您可以始终跟踪客户端代码的执行时间。你知道吗</p>
<p>例如:</p>
<pre><code>import timeit
start_time = timeit.default_timer()
#Your code here
end_time = timeit.default_timer()
print end_time - start_time
</code></pre>
<p>或者使用类似的工具来更深入地了解正在发生的事情:<a href="https://stackify.com/performance-tuning-in-sql-server-find-slow-queries/" rel="nofollow noreferrer">https://stackify.com/performance-tuning-in-sql-server-find-slow-queries/</a></p>