处理分类中稀有因子水平的一般策略？

breakfast lunch dinner mood ----------- ---------- --------- ------ waffles sandwich chili good sausages sandwich pasta good yogurt salad stew bad gruel salad pizza bad gruel pizza pizza good sausages pizza pasta good waffles salad chili good gruel soup pizza bad waffles soup chili good sausages salad pasta good waffles pizza chili good yogurt sandwich stew good yogurt pizza stew good sausages soup pasta good gruel sandwich pizza good yogurt soup waffles good

1条回答

网友

1楼 · 发布于 2024-09-30 16:33:28

现在我知道了行话，我发现这篇文章有一个R用例：stratified splitting the data

应用于我的例子，对晚餐和由此产生的情绪进行分层：

library(splitstackshape)
library(readr)

meals_mood_text <- "breakfast   lunch   dinner  mood
waffles sandwich    chili   good
sausages    sandwich    pasta   good
yogurt  soup    waffles good
yogurt  salad   stew    bad
gruel   salad   pizza   bad
gruel   pizza   pizza   good
sausages    pizza   pasta   good
waffles salad   chili   good
gruel   soup    pizza   bad
waffles soup    chili   good
sausages    salad   pasta   good
waffles pizza   chili   good
yogurt  sandwich    stew    good
yogurt  pizza   stew    good
sausages    soup    pasta   good
gruel   sandwich    pizza   good"

meals_mood_frame <-
  read.table(textConnection(meals_mood_text), header = TRUE)
closeAllConnections()

strat.res <- stratified(meals_mood_frame, c('dinner','mood'), 0.7, bothSets = TRUE)

print(strat.res[[1]])

print(strat.res[[2]])

相关问题更多 >

编程相关推荐

热门问题

热门文章