这篇 A/B 测试指南适合谁？

这份指南适合产品团队、增长营销人员、分析师以及任何正在规划实验、并希望在效果大小、流量和测试设计方面做出更好决策的人。

读完这个页面后我该做什么？

先用这里的解释选择更现实的假设，然后再前往计算器或相关页面，估算你的实验所需流量。

首先确定对产品或商业决策真正重要的效应量，然后将其与基准转化率、置信水平和统计功效相结合。这样的顺序能确保测试结果始终围绕有意义的议题展开。

即使用户界面变化看起来相似，基准转化率、目标效果和流量质量也可能有所不同。因此，决定样本需求的不仅仅是创意，而是统计设置。

实验指南

A/B 测试样本量规划主要在于确定值得检测的变化幅度以及测试结果的置信度。本页将详细介绍该计算背后的实际逻辑。

A/B 测试计划的制定始于最小可检测效应，而非样本量本身。首先要确定什么样的改变才真正有意义，足以影响产品、增长或设计决策。

微小的影响需要更大的样本才能检测到。

置信水平决定了你对随机变异的容忍度。统计功效决定了你检测到真实效应（如果存在）的可能性。两者共同决定了检验的灵敏度。

提高任何一项指标的标准通常都会增加所需的交通流量。

基准转化率是计算的关键。即使目标提升幅度在绝对值上看起来相似，转化率已经达到 2% 的页面与转化率达到 20% 的页面，其表现也会有所不同。

这就是为什么 A/B 测试样本量规划最好使用最新的基线数据而不是粗略估计的原因。

一个有效的步骤是先定义决策阈值，估算一个合理的基线，选择最小可检测效应，最后再考虑样本量。这样可以确保实验与业务相关性，而不是仅仅从流量入手。

它还有助于团队避免设计出技术上有效但实际操作中不切实际的测试。如果运行时间过长，通常需要在发布前修改之前的假设。