计算多标签分类问题的标签数时出错

filenames labels tt3302594.jpg ['deer'] tt2377194.jpg ['deer'] tt2309762.jpg ['dog', 'deer'] tt2870808.jpg ['cat', 'deer'] tt2551396.jpg ['cat', 'dog', 'deer'] tt4008652.jpg ['dog'] tt2926810.jpg ['deer'] tt3531604.jpg ['dog', 'deer'] tt2290739.jpg ['cat', 'deer']

import numpy as np import pandas as pd import seaborn as sns from collections import Counter train = pd.read_csv('example.csv') # reading the csv file meta = pd.DataFrame(train, columns=['filenames', 'labels']) print(f'Found {len(meta)} images') meta.sample(9) all_labels = [label for lbs in meta['labels'] for label in lbs] labels_count = Counter(all_labels) ax = sns.countplot(all_labels, order=[k for k, _ in labels_count.most_common()], log=True) ax.set_title('Number of images with a class label') ax.set_ylim(1E2, 1E4) ax.set_xticklabels(ax.get_xticklabels(), rotation=90);

1条回答

网友

1楼 · 发布于 2024-05-11 03:07:17

您需要使用literal_eval将列表形成的字符串解析为实际列表（此外，对于发布的示例，y lims将使条消失，因此注释），如下所示：

import numpy as np
import pandas as pd
import seaborn as sns
from collections import Counter
import ast

train = pd.read_csv('example.csv')    # reading the csv file
meta = pd.DataFrame(train, columns=['filenames', 'labels'])
print(f'Found {len(meta)} images')
meta.sample(9)
meta['labels'] = [ast.literal_eval(x) for x in meta['labels'].values] 
all_labels = [label for lbs in meta['labels'] for label in lbs]
labels_count = Counter(all_labels)
ax = sns.countplot(all_labels, order=[k for k, _ in labels_count.most_common()], log=True)
ax.set_title('Number of images with a class label')
# ax.set_ylim(1E2, 1E4)
ax.set_xticklabels(ax.get_xticklabels(), rotation=90);

相关问题更多 >

编程相关推荐

热门问题

热门文章