在python中匹配索引以对列进行分类

2024-05-02 15:43:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我在一个长度为1083的数据帧中有一列,有143个唯一值。为了说明我的问题,其中6个是:

  1. 面包房
  2. 医院
  3. 酒店
  4. 牙医
  5. 大学
  6. 餐厅

我已经创建了另一个数据帧,2x1。第一列包含143个唯一值,第二列包含我希望将它们分类为的内容。例如:

 1. bakery       commercial
 2. hospital     commerical
 3. hotel        hospitality
 4. dentist      commercial
 5. university   education
 6. restaurant   hospitality

我想知道如何在我原来的df中创建一个新的列,匹配索引,以便列中的任何条目='bakery'在新列中都是'commercial'。你知道吗


Tags: 数据内容分类酒店餐厅hotel大学commercial
2条回答

您可以使用在程序中某处定义的词典。。。当你试图创建一个新的列时请参考它。。。你知道吗

categories = {"bakery" : "commercial", ... }

然后在需要提取相应值时调用字典:

categories["bakery"] # will return "commercial"

您可以使用merge并执行以下操作:

import pandas as pd
df = pd.merge(  left=firstDataFrame, right=secondDataFrame, on='NameOfColumnContainingBakery...')

on=''中的列名在两个数据帧中必须相同。你知道吗

这会将两个数据帧合并为一个数据帧,其中包含您所描述的附加列。你知道吗

我希望这有帮助。你知道吗

相关问题 更多 >