我试图学习序数尺度(分类)在熊猫身上是如何工作的。你知道吗
import pandas as pd
import numpy as np
student = ["alex","bob","cynthia","daniel","evans"]
tshirt = ["L","XL","S","M","L"]
df = pd.DataFrame(data = tshirt, index=student)
df = df.rename(columns={0:"tshirt"})
tshirt
alex L
bob XL
cynthia S
daniel M
evans L
df = df["tshirt"].astype("category", categories = ["S","M","L","XL"],ordered = True)
当我尝试下面的代码时,它显示为True。你知道吗
df.loc["alex"] < df.loc["daniel"]
它应该是假的(因为L>;M)
我的代码怎么了?你知道吗
首先,你的
df
实际上是一个Series
。。。但无论如何,问题是您要比较值,它们是字符串,具有固有的顺序(词典),而Python就是这样做的。您需要以返回pandas
数据结构的方式选择数据:或者
相关问题 更多 >
编程相关推荐