擅长:python、mysql、java
<p>我认为使用<code>list</code><code>map</code>就足够了</p>
<pre><code>l=list(map(set,df.values.T))
l
Out[71]:
[{'i', 'j', 'o', 'v', 'y'},
{'iw', 'jj', 'vf', 'yk'},
{'iwd', 'jjy', 'ovg', 'vfs', 'yku'}]
list(map(len,l))
Out[74]: [5, 4, 5]
</code></pre>
<hr/>
<p><code>np.unique</code>的用法</p>
<pre><code>def yourfunc(x):
_,indices = np.unique(x, return_inverse=True)
return indices
df.apply(yourfunc)
Out[102]:
0 1 2
0 2 1 2
1 1 1 1
2 4 3 4
3 3 2 3
4 0 0 0
</code></pre>