本文主要参考了黎湘艳、叶洋的经典著作《游戏数据分析实战》。这本书堪称游戏数据分析的开山之作,这里向两位作者表示感谢。
关于留存率的模型,参考4.4.2节。
我们要先计算出1日留存率,2日留存率,……,N日留存率。
作者建议,用幂函数来拟合留存率模型:
两边取对数,可以得到一个线性模型。
liucun <- c(0.39,0.27,0.22,0.19,0.16,0.15,0.15)
d <- 1:7
df <- data.frame(cbind(d,liucun))
df %>% ggplot(aes(x=d,y=liucun)) + geom_point() +geom_line()+xlab('天数')+ylab('留存率')df$logd <- log(df$d)
df$log_liucun <- log(df$liucun)log_model <- lm(log_liucun~logd,data=df)summary(log_model)
b就是斜率,也就是-0.51628
loga是截距,-0.95018,所以a=exp(-0.95018)=0.3867
得到结果
红点是拟合的结果,模型估计的留存率比实际数据下降的略快,如果有更多数据拟合效果会更好。
有了留存率模型,就可以计算日活跃人数。