WEBVTT 00:00:00.190 --> 00:00:02.660 [讲师]我们被问到 00:00:02.660 --> 00:00:05.790 用于构建样本观测值为15的 00:00:05.790 --> 00:00:09.310 关于平均值的98%的置信区间时的 00:00:09.310 --> 00:00:14.170 临界值t星或t星号是多少? 00:00:14.170 --> 00:00:16.630 大概讲一下这里发生了什么, 00:00:16.630 --> 00:00:18.370 你有一个总体, 00:00:18.370 --> 00:00:19.580 这里有一个参数, 00:00:19.580 --> 00:00:21.410 我们叫它是总体平均数。 00:00:21.410 --> 00:00:24.970 我们不知道它是什么,所以我们抽取了一个样本。 00:00:24.970 --> 00:00:27.580 在这里,我们抽取了15个样本。 00:00:27.580 --> 00:00:30.990 所以n等于15,从这个样本中 00:00:30.990 --> 00:00:33.200 我们可以计算出一个样本平均数。 00:00:33.200 --> 00:00:36.340 但我们也要构建一个关于这个样本平均数 00:00:36.340 --> 00:00:38.010 98%的置信区间。 00:00:38.010 --> 00:00:39.880 我们要取这个样本的平均值 00:00:39.880 --> 00:00:42.800 然后再加上或减去一些误差范围。 00:00:42.800 --> 00:00:44.510 在其他视频中,我们已经讨论过 00:00:44.510 --> 00:00:46.690 在这里我们需要使用T分布 00:00:46.690 --> 00:00:49.850 因为我们不希望低估误差范围。 00:00:49.850 --> 00:00:52.665 所以是t星乘以 00:00:52.665 --> 00:00:56.200 样本标准差除以 00:00:56.200 --> 00:00:59.340 样本量的平方根,在这里 00:00:59.340 --> 00:01:02.320 是15,n的平方根。 00:01:02.320 --> 00:01:03.570 他们问我们的是 00:01:03.570 --> 00:01:05.760 什么是合适的临界值? 00:01:05.760 --> 00:01:10.370 在这种情况下,我们应该使用的t星是什么? 00:01:10.370 --> 00:01:13.620 我们要看的是t表, 00:01:13.620 --> 00:01:16.890 而不是Z表,关键是要意识到 00:01:16.890 --> 00:01:19.670 当我们在t表中寻找适当的临界值时, 00:01:19.670 --> 00:01:23.090 有一个额外的变量需要考虑到, 00:01:23.090 --> 00:01:27.340 那就是自由度的概念。 00:01:27.340 --> 00:01:29.670 有时它被简写为df。 00:01:29.670 --> 00:01:31.970 我不打算深入讨论自由度。 00:01:31.970 --> 00:01:34.720 这实际上是一个相当深奥的概念。 00:01:34.720 --> 00:01:36.880 但它是这样一个概念:你实际上会因为一些变量得到不同的t分布 00:01:36.880 --> 00:01:40.670 取决于不同的样本大小, 00:01:40.670 --> 00:01:42.540 取决于自由度。 00:01:42.540 --> 00:01:44.990 而你的自由度是 00:01:44.990 --> 00:01:47.490 你的样本量减去1。 00:01:47.490 --> 00:01:50.060 在这种情况下,我们的自由度是 00:01:50.060 --> 00:01:54.100 15减去1,所以我们的自由度 00:01:54.100 --> 00:01:56.160 等于14。 00:01:56.160 --> 00:01:58.450 这并不是我们第一次使用自由度。 00:01:58.450 --> 00:02:00.530 我们在第一次谈及样本标准差时, 00:02:00.530 --> 00:02:03.470 就谈到了自由度的问题, 00:02:03.470 --> 00:02:05.210 以及如何对总体标准差 00:02:05.210 --> 00:02:07.390 进行无偏估计。 00:02:07.390 --> 00:02:09.840 在以后的视频中,我们将更加深入地探讨更多 00:02:09.840 --> 00:02:12.080 关于自由度的话题,但就本例而言 00:02:12.080 --> 00:02:14.640 在这个例子中,你只需要知道的是 00:02:14.640 --> 00:02:17.380 当你在看一个给定自由度的t分布的时候, 00:02:17.380 --> 00:02:19.640 你的自由度 00:02:19.640 --> 00:02:21.490 是基于样本量的, 00:02:21.490 --> 00:02:23.760 当我们考虑平均数的置信区间时, 00:02:23.760 --> 00:02:26.280 你自由度是样本量减去1。 00:02:26.280 --> 00:02:29.080 现在让我们来看看t表。 00:02:29.080 --> 00:02:32.005 我们想要一个98%的置信区间 00:02:32.005 --> 00:02:35.893 而且我们需要自由度为14。 00:02:36.890 --> 00:02:40.010 让我们把T表拿出来, 00:02:40.010 --> 00:02:41.940 我实际上是复制并粘贴了表的底部,并把它和顶部放在了一起, 00:02:41.940 --> 00:02:43.650 所以你大致能看到整个表的内容。 00:02:43.650 --> 00:02:45.300 这个T表的有用之处 00:02:45.300 --> 00:02:47.300 是它在这里给出了我们的置信水平 00:02:47.300 --> 00:02:50.450 所以如果你想要一个98%的置信水平, 00:02:50.450 --> 00:02:53.020 你要看这一列。 00:02:53.020 --> 00:02:55.580 你要看这里的这一列。 00:02:55.580 --> 00:02:59.160 另一种思考关于98%的置信水平的方式是: 00:02:59.160 --> 00:03:02.620 如果你有一个98%的置信水平, 00:03:02.620 --> 00:03:07.230 这意味着你在分布的任何一端 00:03:07.230 --> 00:03:09.680 都留下了1%的未填数据。 00:03:09.680 --> 00:03:12.780 所以这时如果你看你的T分布,包括最左端的1%时, 00:03:12.780 --> 00:03:16.620 你会想要找 00:03:16.620 --> 00:03:21.450 尾部概率为0.01,你可能看不清楚。 00:03:21.450 --> 00:03:23.040 让我换一个亮一点的颜色来标注, 00:03:23.040 --> 00:03:25.820 这将是右边的尾部概率。 00:03:25.820 --> 00:03:27.650 无论哪种思考方式,我们都需要看这一列。 00:03:27.650 --> 00:03:30.080 我们的置信水平是98%。 00:03:30.080 --> 00:03:32.330 记住,我们的自由度 00:03:32.330 --> 00:03:37.193 我们的自由度在这里,我们的自由度为14。 00:03:37.193 --> 00:03:41.613 我们要看一下这一行。 00:03:41.613 --> 00:03:43.210 所以,你找到了。 00:03:43.210 --> 00:03:46.333 这是我们的临界t值,2.624。 00:03:48.750 --> 00:03:51.200 让我们回到选项。 00:03:51.200 --> 00:03:56.200 2.264是这道题的选择。