我正在写我的第一个熊猫数据探索笔记本,我遇到了一些熊猫操作的问题,比如标题的clip
。你知道吗
我有一个包含以下列和数据类型的数据框:
kairaId object
sex object
primaryPerson bool
birthDay float64
birthMonth float64
birthYear float64
deathYear float64
ownHouse object
returnedKarelia object
previousMarriages object
pageNumber object
sourceTextId object
professionId int64
professionName object
placeName object
region object
stemmedName object
extractedName object
latitude float64
longitude float64
children_count int64
migration_count float64
dtype: object
我想删除一些基于经度的异常行。我以为熊猫的clip
会起作用:
df = df.clip(None, upper=50.0, axis='longitude')
然而,这会导致TypeError: unorderable types: str() >= float()
。你知道吗
我意识到Pandas试图比较strs和float,这导致了python3中的一个错误,但我不明白为什么,也不知道如何规避这个问题。显然是其他栏目的内容干扰了这一点?我在尝试其他操作时也遇到了错误。你知道吗
More context in the form of Jupyter notebook
我的数据框架有什么根本性的错误吗?是否有与此问题相关的文档?我今天晚上刚刚挑选了熊猫,所以我还不确定哪些文档是相关的,也不知道数据帧在幕后是如何工作的。我可能会买一本关于这个话题的书。你知道吗
我认为您误解了
df.clip
的用法-它是为了使异常值符合某些特定的外部边界,而不是删除它们。文档中的一个示例:另外,
axis
参数将引用0或1(沿行或列应用)。它根本不引用列。你知道吗在本例中,您希望删除与异常经度关联的所有记录。为此,您应该按照
df.filter
、df.mask
、df.query
、甚至仅仅boolean indexing
的思路使用:相关问题 更多 >
编程相关推荐