增长黑客AB-Test系统(四)——AB-Test 最小样本量

article/2025/3/15 10:03:31

作者:livan

来源:数据python与算法

前沿

统计计算主要应用在效果评估领域。客户经过分流之后在各个试验组中产生数据,统计的作用即为查看对应组的样本量是否达到最小样本量,数据之间是否存在显著性差异,以及进行差异大小的比较。

如下图:

A-A-B三组数据观察n天后,会产生3组数据,我们接下来的任务就是计算这三组数据的统计效果,进而确定哪个方案效果好……

最小样本量

最小样本量是按照统计功效进行计算的,主要分两类:绝对值类(例如:UV)和比率类(例如:点击率)。

在试验过程中,大部分场景是进行比率类指标的比较,单纯的计算绝对值是没有价值的,而且对于试验效果来讲,绝对值的比较可以转化为比率的比较,所以在计算过程中,我们统一成比率计算,以方便口径统一和数值比较。

理论上,比率类最小样本量计算:

其中Z为z系数,统计中Z值有一个固定的Z值表,可以依据α和β指标确定出对应的Z值,工业应用中一般默认使用α=0.1(单尾)和β=0.2,因此公式中:

Zα/2+Zβ=Z0.05+Z0.2=1.6449+0.84=2.4849

可以定为固定值。

d即为对照组历史数据的月均值与提升率的乘积:

提升率detection left%”是需要用户在页面中录入的部分,比如:新方案预期指标提升率为2%,则提升率detection left%=2%。

“历史月均值mean”是对应观测指标在过去一个月的数据均值。

例如:

“XX提交”按钮由红色变为橙色,统计的指标是点击UV转化率UV_rate,测试时间是20200801~20200814,则计算“XX提交”按钮的历史月均值mean(UV_rate)为下面数据的均值avg(UV_rate):

由此,可以计算出公式中的d

注:UV、PV等绝对值的比较需要先转化成rate值进行计算。

最小样本量计算中的σ计算逻辑与d类似,同样是计算历史一个月的指标方差值,上面案例中:

σ=σ(UV_rate)

在比率方差运算时,对应的计算公式为:

σ(UV_rate)=P(1-P)

其中,P为统计值UV_rate的均值,即:

avg(UV_rate)

所以上面公式可以调整为:

注:比率的方差计算方式与绝对值的方差计算:

逻辑一致,得到两值差异不大,只是计算公式不同而已。

因此比率类最小样本量公式可变为:

到此,可确定AB测试最小样本量的计算公式。

注:此处的计算需要对统计学中的统计功效有所了解,阅读有阻力可以补充一下“统计功效”的计算方法。

最小样本量流程图

最小样本量的作用是确定试验是否有效,后管配置好对应的客群信息、开放流量占比、提升率等信息后,后台需要进行“最小样本量”的计算,并进行相关判断,如下图:

步骤:

   1)用户在后管配置页面中输入预期的提升率x%、监控的数据指标_rate、对应的客群范围以及开多少流量;    

   2)获取到试验前30天数据,计算对应的数据指标_rate(如上例的UV_rate),并计算出30个数值的avg(数值指标_rate);

   3)后台获取到提升率x%之后,将x%和avg(数值指标_rate)带入到上面最小样本量计算公式中,确定对应的最小样本量n。

   4)判断圈定出来的客群流量*m%最小样本量n的大小,如果客群流量*m% < 最小样本量n则提示样本量不足,如果客群流量*m% >= 最小样本量n则进行分桶分流操作。

   5)基于n确定各个试验组的样本量为:(n(A) = n(A) = n(B)) >= n/3

当分流出的单组样本量大于n/3时,试验结果才有可信度,否则试验结果不可信。此处我们做了一个假设,即在计算最小样本量时假设样本量即活跃量,实际试验中并非如此,所以实际试验中,单组样本数据量宜大于n/3。

试验有效天数

确定好最小样本量并实现分流、试验上线之后,需要进行数据的有效天数需要进行相应计算:

试验的有效天数即为试验进行多少天能达到流量的最小样本量。当流量达到最小样本量时,查看数据是否存在显著性差异,如果不存在显著性差异则继续进行试验,直到达到最大要求天数,如果试验仍然没有达到显著性,则确定两组试验不显著,即没有明显差异。

计算过程如图:

计算说明:

   1)假设有m%的流量参与试验,则第一天时选择对应的流量m%,A-A-B三组中各自的流量为m/3。

   2)第二天(t+1天数据)时,依然选择m%的流量,这些流量包含两部分:其一为已经打标的客户第二天重新访问APP的数量,数量为:a12,a22,b12;其二为需要新划分的流量ax1,ax2,bx1,得到流量划分的计算公式为:

计算打标的客户是否已经满足最小样本量n_per:

同时计算当前时间下A-A-B三组试验的显著性

   3)试验期间的每一天都进行如上计算,得到每天的访问量以及显著性。

   4)判断试验天数是否到达试验最小天数(7天):

   如果到达试验最小天数且试验样本量>=最小样本量n_per,则观察试验是否有显著性,如果A-A试验没有显著性且A-B存在显著性(B>A),则表示试验成功,否则试验失败。

   如果到达试验最小天数且试验样本量<最小样本量n_per,则继续进行试验;

   5)判断试验天数是否到达试验最大天数(t天):

   如果到达试验最大天数且试验样本量>=最小样本量n_per,则观察显著性;

   如果到达试验最大天数且试验样本量<最小样本量n_per,则终止试验并标注试验失败。

逻辑流程图为:       

    通过每天的数据计算可以做出如上判断,进而确定试验进行的有效天数并计算出显著性水平。

AB-testing工程化

经过上面的描述,我们可以通过下面的两张图来了解一下在工程方面,AB测试系统是什么样子的:

注释:

   1)根据需求设计好AB试验之后,在AB测试系统配置好对应的策略;

   2)将这一策略固化成文件,并推送到APP的AB系统SDK中;

   3)客户每次访问APP,先扫描AB系统SDK中的策略文件,根据策略文件给客户打标,分配对应的A、B版本;

   4)APP中根据策略呈现A、B版本的试验内容,并监控客户的操作行为以及订单行为;

   5)这一行为被记录并上报到大数据环境中;

   6)每天在大数据中进行显著性计算和最小样本量的处理,得到对应的显著性结果。

   我们再来看一个详细的系统数据,如下图:

目前为止,AB系统已经介绍完成了,AB的结构深不可测,其中也需要经常的更新和讨论,欢迎大家关注沟通~

◆ ◆ ◆  ◆ ◆

麟哥新书已经在京东上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前京东正在举行100-50活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:

点击下方小程序即可进入购买页面:


数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。

管理员二维码:

猜你喜欢

● 麟哥拼了!!!亲自出镜推荐自己新书《数据分析师求职面试指南》

● 厉害了!麟哥新书登顶京东销量排行榜!

● 笑死人不偿命的知乎沙雕问题排行榜

● 用Python扒出B站那些“惊为天人”的阿婆主!

● 你相信逛B站也能学编程吗

点击阅读原文即可参与京东100-50购书活动


http://chatgpt.dhexx.cn/article/P5vpXL9C.shtml

相关文章

A/B test --计算实验所需样本量

如果懒得看下方内容&#xff0c;或者是看完了还有些许不懂&#xff0c;可以直接用这个好用又免费的计算器来计算 https://www.evanmiller.org/ab-testing/sample-size.html 新加一个 https://www.eyeofcloud.com/abtest-widget/124.html …………………………………………………

如何确定抽样统计的最小样本量(附:随机抽样统计的抽样误差Excel计算表格)

在电视节目中经常看到关于选举的报道中经常会后有支持率的数字,例如:调查结果为 a方支持率为45.3%;b方支持率为30.2%;c方支持率为8.5%;...最后都会说明一下,此次电话调查的数量2300,置信度为95%﹐最大容许误差为2.5%,这就是抽样调查的典型情景:一个大的集合(比如:数…

你们要的最小样本量计算来了。

总第179篇/张俊红 这一篇我们讲讲统计中的最小样本量计算。大家先想想为什么叫最小样本量&#xff0c;而不是最大或者直接叫样本量计算呢&#xff1f; 这是因为最小样本量这个概念主要用在抽样统计中&#xff0c;抽样统计为了研究某一事物的情况而从整体中抽取部分样本来进行研…

问卷分析预调查之确定样本容量

在问卷预调查&#xff0c;不仅能够检验出不符合的题项&#xff0c;也能确定调查所需要的样本容量&#xff0c;根据以下公式可以确定 公式介绍&#xff1a;n 表示样本数量&#xff0c; Z 表示置信水平&#xff0c; σ 表示样本总量中某一特定属性样本的比例&#xff08;比如说在…

如何确定抽样的样本数量

总体为9200人&#xff0c;预设的整体置信度为95%&#xff0c;最大容许误差为正负5%&#xff0c;求样本容量 网上搜到的第一个有价值的内容如下&#xff1a; 题目 某公司对60000人中的吸烟比例做调查,置信度为95%的情况下,若要使误差保持在4%以内,需要的最小样本容量是 这里并…

样本容量的确定

• 样本容量&#xff1a; 样本中个体的数目或组成抽样总体的单位数。 • 必要样本容量 &#xff1a; 亦称必要样本单位数&#xff0c;是指满足调查目的要求的情况下&#xff0c;至少需要选择的样本单位数。 一、估计总体均值时样本容量的确定 1.重复抽样 一旦确定了置信水平&…

Topic 5. 样本量确定及分割

每次做方案设计的时候&#xff0c;都会涉及到一个尖锐的问题&#xff0c;客户会问我得用多少的样本量才能发文章&#xff0c;这个嘛&#xff0c;事情从理论上回答还是有依据的&#xff0c;但是从实际出发永远都是 “理想很丰满&#xff0c;现实很骨感&#xff01;” 。不过还是…

参数估计-两个参数总体区间估计、样本量确定(三)

2019独角兽企业重金招聘Python工程师标准>>> 一、两个总体均值之差的区间估计 1、大样本估计 两个总体为正态分布,或两个总体不服正态分布但两个样本都为大样本,根据抽样分布知识可知 两个样本均值只差 服从期望为(μ1-μ2)、方差为( )的正态分布,转化为标准…

ABtest如何确定样本量?

如何计算样本量 商业分析的面试&#xff0c;很少会让面试者直接默写公式并进行计算。为啥&#xff1f;一&#xff0c;面试官八成自己也不记得公式。二&#xff0c;真实工作都是用网上的计算器&#xff0c;一键呵成&#xff0c;无需手算。 网上随手找的的sample size计算器 那么…

Topic 5. SCI 文章之样本量确定及分割

**每次做方案设计的时候&#xff0c;都会涉及到一个尖锐的问题&#xff0c;客户会问我得用多少的样本量才能发文章&#xff0c;这个嘛&#xff0c;事情从理论上回答还是有依据的&#xff0c;但是从实际出发永远都是 “理想很丰满&#xff0c;现实很骨感&#xff01;” 。不过还…

AB实验样本量确定

文章目录 1. 统计功效与关键概念2. Z检验样本量确定2.1 统计功效公式推导2.2 样本量计算公式2.3 求解样本量 3. 卡方检验样本量确定3.1 求解样本量 4. 简要总结Reference 在数据分析过程中&#xff0c; 一个完整的闭环是从数据中得到洞察&#xff0c;根据洞察得到某种假设&…

临床试验中样本量确定的统计学考虑

样本量确定(sample size determination)&#xff0c;又称样本量估计(sample size estimation)&#xff0c;是指为满足统计的准确性和可靠性(I类错误的控制和检验效能的保证)计算出所需的样本量&#xff0c;它是临床试验设计中一个极为重要的环节&#xff0c;直接关系到研究结论…

在前端中的缓存

http缓存 http缓存基本认识 http缓存分为强缓存和协商缓存 1、浏览器在加载资源时&#xff0c;先根据这个资源的一些http header判断它是否命中强缓存&#xff0c;强缓存如果命中&#xff0c;浏览器直接从自己的缓存中读取资源&#xff0c;不会发请求到服务器。比如某个css文…

前端缓存方案

前端几种本地缓存机制_蜗牛小前的博客-CSDN博客_前端本地缓存在漫长的前端开发过程中&#xff0c;我们常用的几种本地缓存机制&#xff1a;Cookie,LocalStorge,SessionStorge 1.Cookie的特点1&#xff09;cookie的大小受限制&#xff0c;cookie大小被限制在4KB&#xff0c;不能…

【前端】深入浅出缓存原理

缓存的基本原理 对于前端来说&#xff0c;缓存主要分为浏览器缓存&#xff08;比如 localStorage、sessionStorage、cookie等等&#xff09;以及http缓存&#xff0c;也是本文主要讲述的。 当然叫法也不一样&#xff0c;比如客户端缓存大概包括浏览器缓存和http缓存 所谓htt…

前端浏览器缓存机制

目录 1 缓存定义及其优点2 强缓存2.1 expires 和 Cache-Control 3 协商缓存4 浏览器缓存位置 1 缓存定义及其优点 什么是缓存&#xff1f; 当我们第一次访问网站的时候&#xff0c;电脑会把网站上的图片和数据下载到电脑上&#xff0c;当我们再次访问的时候&#xff0c;网站就会…

前端缓存机制

目录 前言 目的 缓存过程分析 强制缓存&#xff08;强缓存&#xff09; 强制缓存的缓存规则 浏览器的缓存存放在哪里 协商缓存 更新缓存 合理应用缓存 前言 对于浏览器缓存&#xff0c;每个前端开发者应该都不会陌生&#xff0c;同时它也是我们在日常开发中存在的一个…

前端缓存【web缓存】

前端缓存--http缓存 web缓存http缓存定义优点缺点http缓存类型 强缓存Expires实现的强缓存Cache-control实现的强缓存 协商缓存last-modified实现的协商缓存ETag实现的协商缓存缺点 设置缓存文件缓存&#xff08;html、js、css、png)总结 web缓存 web缓存主要指&#xff1a;浏…

前端缓存(HTTP缓存、浏览器缓存)浅析

前端缓存 文章目录 前端缓存缓存分类1、http缓存(1)强缓存&#xff08;本地缓存&#xff09;启发式缓存 (2)协商缓存&#xff08;弱缓存&#xff09; 2、浏览器缓存 其他响应头和请求头参数刷新正常重新加载硬性重新加载清空缓存并硬性重新加载 调试缓存 缓存分类 1、http缓存 …

前端缓存最佳实践

点击上方“前端开发博客”&#xff0c;选择“设为星标” 回复“2”加入前端群 作者&#xff1a;黑金团队https://juejin.cn/post/6844903737538920462 前言 缓存&#xff0c;这是一个老生常谈的话题&#xff0c;也常被作为前端面试的一个知识点。本文&#xff0c;重点在与探讨在…