擅长:python、mysql、java
<p>首先需要创建一个元组数组,<code>pandas.lib.fast_zip</code>在cython循环中可以非常快地完成此操作。</p>
<pre><code>import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
print pd.factorize(pd.lib.fast_zip([df.x, df.y]))[0]
</code></pre>
<p>输出为:</p>
<pre><code>[0 1 2 2 1 0]
</code></pre>