数据扩展R/Python

2024-10-16 22:33:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个大的csv文件记录如下

name         year         value
brand1       2000         45,000
brand2       2000         42,000
brand3       2000         46,000

brand1       2001         41,600
brand2       2001         49,000
brand4       2001         47,000

brand1       2002         39,000
brand5       2002         40,500
brand3       2002         42,800

我想将我的大csv转换为如下所示,以便捕获跨越所有记录年份的所有唯一名称,并且当名称在特定记录年份中丢失时,其值等于零。看这个,

name       year      value
brand1       2000         45,000
brand2       2000         42,000
brand3       2000         46,000
brand4       2000         0000
brand5       2000         0000

brand1       2001         41,600
brand2       2001         49,000
brand4       2001         47,000
brand3       2001         0000
brand5       2001         0000

brand1       2002         39,000
brand5       2002         40,500
brand3       2002         42,800
brand2       2002         0000
brand4       2000         0000

想法


Tags: 文件csvname名称value记录year年份
1条回答
网友
1楼 · 发布于 2024-10-16 22:33:10

在R中有一个解决方案

library(tidyverse)

df <- data.frame(name = c("brand1", "brand2", "brand4", "brand5", "brand1"), 
                 year = c(2000, 2000, 2000, 2001, 2001),
                 value = c(53, 32, 242, 43, 23))


df1 <- df %>% complete(year, name, fill = list(value = 0))

相关问题 更多 >