核心概念
置信水平与误差范围
这两个设置经常被放在一起提及,但它们的作用不同。置信水平控制确定性,而误差范围控制精确度。
自信程度关乎确定性。
置信水平描述的是在重复抽样的情况下,你对样本区间包含总体真实值的把握程度。置信水平越高,意味着越谨慎,通常也需要更大的样本量。
在实际调查工作中,95% 是最常见的选择,因为它兼顾了严谨性和成本。
误差范围关乎精度。
误差范围是指估计值周围不确定范围的宽广程度。误差范围越小,报告范围越窄,但需要更大的样本量。
这就是为什么从 +/- 5% 缩小到 +/- 3% 可以显著增加样本量的原因。
它们如何协同工作
如果同时提高置信度并降低误差范围,样本量会迅速增加,因为你同时要求更高的确定性和更高的精确度。
当所需样本量看起来过高时,这些通常是首先要审查的假设。
首先应该重新调整哪个设置
当样本需求量过高时,通常更应该首先调整误差范围,因为过于严格的精度目标成本很高。置信水平固然重要,但团队通常会出于各种原因默认使用 95% 的置信水平,然后调整精度。
这并不意味着原则上某种设置比另一种更重要。而是说,在实际项目中,它们的权衡取舍会有所不同,最佳选择取决于出错的后果与不精确的后果孰轻孰重。
- 利用置信水平来管理确定性标准
- 利用误差范围来控制估算的精确度。
- 当这两项标准都收紧时,预计样本量会迅速增加。
- 在接受不切实际的目标之前,请仔细审查所有设置。