熊猫分类不如预期工作

2024-10-02 10:32:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图学习序数尺度(分类)在熊猫身上是如何工作的。你知道吗

import pandas as pd
import numpy as np

student = ["alex","bob","cynthia","daniel","evans"]
tshirt = ["L","XL","S","M","L"]
df = pd.DataFrame(data = tshirt, index=student)
df = df.rename(columns={0:"tshirt"})




       tshirt
  alex    L
  bob     XL
  cynthia S
  daniel  M
  evans   L

df = df["tshirt"].astype("category", categories = ["S","M","L","XL"],ordered = True)

当我尝试下面的代码时,它显示为True。你知道吗

df.loc["alex"] < df.loc["daniel"]

它应该是假的(因为L>;M)

我的代码怎么了?你知道吗


Tags: 代码importtruedfasstudentlocpd
1条回答
网友
1楼 · 发布于 2024-10-02 10:32:59

首先,你的df实际上是一个Series。。。但无论如何,问题是您要比较,它们是字符串,具有固有的顺序(词典),而Python就是这样做的。您需要以返回pandas数据结构的方式选择数据:

In [2]: df[['alex']] < df[['daniel']]
Out[2]:
alex    False
Name: tshirt, dtype: bool

或者

In [3]: df.loc[['alex']] < df.loc[['daniel']]
Out[3]:
alex    False
Name: tshirt, dtype: bool

相关问题 更多 >

    热门问题