置信区间(CI)是可能包含具有一定置信度的总体值的值范围。它通常用百分比表示,总体平均值介于上限和下限之间。

95%置信区间是什么意思?

95%置信区间是一个可以确定95%包含总体真实均值的值范围。随着样本数量的增加,间隔值的范围将变窄,这意味着与较小的样本相比,该平均值具有更高的准确性。

我们可以使用正态分布对其进行可视化(请参见下图)。

例如,总体平均值与样本平均值之间的平均值介于-1.96和+1.96标准偏差(z得分)之间的可能性为95%。

因此,总体均值有5%的概率位于上下置信区间的范围内(如1.96 z得分的任一侧的异常值的2.5%所示)。

研究人员为什么要使用置信区间?

研究人口中的每个人或多或少是不可能的,因此研究人员选择人口的一个样本或亚组。

这意味着研究人员只能估计总体的参数(即特征),估计范围是从给定的一组样本数据中计算得出的。

因此,置信区间只是衡量样本代表所研究人群的好坏的一种方法。

置信区间包含总体中真实平均值的概率称为CI的置信度。

您可以根据自己喜欢的任何置信度来计算CI,但最常用的值是95%。95%置信区间是一个值范围(上下),可以确定95%包含总体的真实均值。