擅长:python、mysql、java
<p>下面的代码假设您已经知道一行中的最大项数。这意味着您需要读取该文件一次并找到这些信息(在这里,根据您的示例,我们假设这个数字是3)。在</p>
<pre><code>max_num_of_items_in_one_row = 3
cols = range(max_num_of_items_in_one_row)
df = pd.read_csv('genre.txt', names=cols, engine='python', skiprows=1)
df = df.applymap(lambda x: 'NA' if x==None else x)
all_ = df.values.flatten()
genres = np.unique(all_)
for y in genres:
tmp = df.applymap(lambda x: 1 if x==y else 0)
print(y, tmp.values.flatten().sum())
</code></pre>
<p>该代码将文件读入一个dataframe,去掉None值,在dataframe中找到所有惟一的值,并计算它们在dataframe中的出现次数。在</p>