如何分析Pandas中的谷歌表单复选框(多个答案)答案?

2024-10-16 20:43:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我正试图进一步分析我通过谷歌表单收到的一份调查报告。下面是我的CSV的外观(有更多的列,但为了这个示例,我将只显示一列):

Parks and Trails| Playgrounds
Parks and Trails| Outdoor/Indoor Aquatic Facilities| Community Events and Festivals| Park
Parks and Trails| Art Class, Event, Concert, Exhibit or Performance| Sports Facilities

如您所见,每行都有多个选定选项。现在,我知道我可以像countplot一样查看每个选项被选中的实例数,但它们都需要在一个列表中,然后我需要用“|”将其拆分,但我不能这样做,因为它们在不同的行中,对吗

因此,现在我正在努力进行分析,我想我必须编写虚拟代码,但我真的不确定如何进行,因为pd.get_dummies()将基于整行编写虚拟代码。因此,“公园和小径|游乐场”将成为一个虚拟变量,“公园和小径|室外/室内水生设施|社区活动和节日|公园”将成为另一个虚拟变量

那么,我该怎么做呢

提前谢谢你


Tags: andcsv代码表单示例选项外观trails