本文介绍了是不重新启动计数的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
这与以下问题相同但我想保留日期.请先阅读.
This is the same as thisquestion but I want to preserve the date. Please read that first.
library(dplyr) library(tidyverse) df <- tibble(mydate = as.Date(c("2019-05-11 23:01:00", "2019-05-11 23:02:00", "2019-05-11 23:03:00", "2019-05-11 23:04:00", "2019-05-12 23:05:00", "2019-05-12 23:06:00", "2019-05-12 23:07:00", "2019-05-12 23:08:00", "2019-05-13 23:09:00", "2019-05-13 23:10:00", "2019-05-13 23:11:00", "2019-05-13 23:12:00", "2019-05-14 23:13:00", "2019-05-14 23:14:00", "2019-05-14 23:15:00", "2019-05-14 23:16:00", "2019-05-15 23:17:00", "2019-05-15 23:18:00", "2019-05-15 23:19:00", "2019-05-15 23:20:00")), myval = c(0, NA, 1500, 1500, 1500, 1500, NA, 0, 0, 0, 1100, 1100, 1100, 0, 200, 200, 1100, 1100, 1100, 0 )) # just replace values [0,1] with NA df$myval[df$myval >= 0 & df$myval <= 1] <- NA df <- df %>% group_by(myval) %>% mutate(counts = sum(myval == myval)) %>% mutate(result = (myval / counts))现在的结果是:
mydate myval counts result <date> <dbl> <int> <dbl> 1 2019-05-11 NA NA NA 2 2019-05-11 NA NA NA 3 2019-05-11 1500 4 375 4 2019-05-11 1500 4 375 5 2019-05-12 1500 4 375 6 2019-05-12 1500 4 375 7 2019-05-12 NA NA NA 8 2019-05-12 NA NA NA 9 2019-05-13 NA NA NA 10 2019-05-13 NA NA NA 11 2019-05-13 1100 6 183. 12 2019-05-13 1100 6 183. 13 2019-05-14 1100 6 183. 14 2019-05-14 NA NA NA 15 2019-05-14 200 2 100 16 2019-05-14 200 2 100 17 2019-05-15 1100 6 183. 18 2019-05-15 1100 6 183. 19 2019-05-15 1100 6 183. 20 2019-05-15 NA NA NA我想保留上面的数据框,包括日期列和正确的结果.
I want to preserve the above dataframe, wth the dates column and the correct result.
如果值不存在/在NA之前/之后,我需要以某种方式重新开始计数.
I need somehow to restart the counting if after/before a value a NA exists.
所以,对于1100,我必须有3次两次而不是6次.
So, for 1100 , I must have count 3 two times and not count 6.
推荐答案您可以使用 data.table rleid 创建组:
library(dplyr) df %>% group_by(grp = data.table::rleid(myval)) %>% mutate(counts = n(), result= myval/counts) # mydate myval grp counts result # <date> <dbl> <int> <int> <dbl> # 1 2019-05-11 NA 1 2 NA # 2 2019-05-11 NA 1 2 NA # 3 2019-05-11 1500 2 4 375 # 4 2019-05-11 1500 2 4 375 # 5 2019-05-12 1500 2 4 375 # 6 2019-05-12 1500 2 4 375 # 7 2019-05-12 NA 3 4 NA # 8 2019-05-12 NA 3 4 NA # 9 2019-05-13 NA 3 4 NA #10 2019-05-13 NA 3 4 NA #11 2019-05-13 1100 4 3 367. #12 2019-05-13 1100 4 3 367. #13 2019-05-14 1100 4 3 367. #14 2019-05-14 NA 5 1 NA #15 2019-05-14 200 6 2 100 #16 2019-05-14 200 6 2 100 #17 2019-05-15 1100 7 3 367. #18 2019-05-15 1100 7 3 367. #19 2019-05-15 1100 7 3 367. #20 2019-05-15 NA 8 1 NA更多推荐
是不重新启动计数
发布评论