<h2><code>pd.value_counts</code></h2>
<p>也可以将列表传递给<code>value_counts</code>函数。注I <code>join</code>除以<code>|</code>,然后再除以<code>|</code>。在</p>
<pre><code>pd.value_counts('|'.join(df.column_name).split('|'))
book 3
fish 2
icecream 1
campfire 1
dtype: int64
</code></pre>
<hr/>
<h2><code>get_dummies</code></h2>
<p>这是因为数据是用<code>|</code>作为分隔符的。如果有不同的分隔符,请将其传递给<code>get_dummies</code>调用<code>df.column_name.str.get_dummies(sep='|').sum()</code></p>
^{pr2}$
<p>如果你想把结果排序</p>
<pre><code>df.column_name.str.get_dummies().sum().sort_values(ascending=False)
book 3
fish 2
icecream 1
campfire 1
dtype: int64
</code></pre>
<hr/>
<h2><code>pd.factorize</code>和{<cd11>}</h2>
<p>请注意,我<code>join</code>整个列并再次拆分。在</p>
<pre><code>f, u = pd.factorize('|'.join(df.column_name).split('|'))
pd.Series(np.bincount(f), u)
book 3
fish 2
icecream 1
campfire 1
dtype: int64
</code></pre>
<p>要排序,我们可以像上面那样使用<code>sort_values</code>。或者这个</p>
<pre><code>f, u = pd.factorize('|'.join(df.column_name).split('|'))
counts = np.bincount(f)
a = counts.argsort()[::-1]
pd.Series(counts[a], u[a])
book 3
fish 2
campfire 1
icecream 1
dtype: int64
</code></pre>