擅长:python、mysql、java
<p>我觉得把熊猫描述为“改进”纽比/希比,这一点大错特错了。Numpy/Scipy非常专注于高效的数值计算和解决科学家和工程师经常解决的数值问题。如果你的问题是从公式开始的,并且涉及到从那里得到的数值解,你可能对这两个问题很在行。在</p>
<p>Pandas更适合于以存储在文件或数据库中的数据为起点的问题,这些数据既包含字符串也包含数字。考虑从数据库查询中读取数据的问题。在Pandas中,可以直接使用<a href="http://pandas.pydata.org/pandas-docs/dev/generated/pandas.read_sql_query.html">^{<cd1>}</a>并在一行中拥有数据的可用版本。Numpy/SciPy中没有等效的功能。在</p>
<p>对于具有字符串或离散数据而不是连续数据的数据,没有等效的<a href="http://pandas.pydata.org/pandas-docs/stable/groupby.html">^{<cd2>}</a>功能,也没有类似于数据库的表在匹配值上的联接。在</p>
<p>对于时间序列,使用日期时间索引<a href="http://pandas.pydata.org/pandas-docs/dev/timeseries.html">handling time series data</a>有很大的好处,它允许您平滑地重新采样到不同的间隔,填充值并极容易地绘制序列。在</p>
<p>由于我的许多问题都是在电子表格中开始的,我也非常感谢对<code>.xls</code>和{<cd4>}格式的Excel文件的相对透明处理。在</p>
<p>还有一个更大的生态系统,与基本的numpy/scipy相比,seaborn这样的软件包能够更流畅地进行统计分析和模型拟合。在</p>