如何使用Dplyr R(如Python中的df.count())计算数据帧的nonNA观察数

2024-06-25 23:29:51 发布

您现在位置:Python中文网/ 问答频道 /正文

这应该很容易:计算R数据帧中未丢失的观测值的数量

我有一个数据框,其中列缺少(NA)值。我想知道哪些列缺少太多的观测值。这个问题很简单,在Python中这很简单,只需运行

df.count()

在数据框上,显示每列的非缺失观测值

然而,使用R的tidyverse,这看起来非常复杂。有很多关于分组计数的建议,但是,在这种情况下,我不想使用分组计数

我试过:

mtcars %>%
  select(everything()) %>%  
  summarise_all(funs(sum(!is.na(.))))

不幸的是,它抛出了一个错误,因为'funs()' was deprecated in dplyr 0.8.0.


Tags: 数据df数量count情况select建议计数
2条回答

summarise_allfuns都不推荐使用。您可以使用across-

library(dplyr)
mtcars %>% summarise(across(.fns = ~sum(!is.na(.))))

或在R基-

colSums(!is.na(mtcars))

我们可以使用complete.cases

library(dplyr)
mtcars %>%
    summarise(across(everything(), ~ sum(complete.cases(.))))

相关问题 更多 >