0:00:00.190,0:00:02.660 [讲师]我们被问到 0:00:02.660,0:00:05.790 用于构建样本观测值为15的 0:00:05.790,0:00:09.310 关于平均值的98%的置信区间时的 0:00:09.310,0:00:14.170 临界值t星或t星号是多少? 0:00:14.170,0:00:16.630 大概讲一下这里发生了什么, 0:00:16.630,0:00:18.370 你有一个总体, 0:00:18.370,0:00:19.580 这里有一个参数, 0:00:19.580,0:00:21.410 我们叫它是总体平均数。 0:00:21.410,0:00:24.970 我们不知道它是什么,所以我们抽取了一个样本。 0:00:24.970,0:00:27.580 在这里,我们抽取了15个样本。 0:00:27.580,0:00:30.990 所以n等于15,从这个样本中 0:00:30.990,0:00:33.200 我们可以计算出一个样本平均数。 0:00:33.200,0:00:36.340 但我们也要构建一个关于这个样本平均数 0:00:36.340,0:00:38.010 98%的置信区间。 0:00:38.010,0:00:39.880 我们要取这个样本的平均值 0:00:39.880,0:00:42.800 然后再加上或减去一些误差范围。 0:00:42.800,0:00:44.510 在其他视频中,我们已经讨论过 0:00:44.510,0:00:46.690 在这里我们需要使用T分布 0:00:46.690,0:00:49.850 因为我们不希望低估误差范围。 0:00:49.850,0:00:52.665 所以是t星乘以 0:00:52.665,0:00:56.200 样本标准差除以 0:00:56.200,0:00:59.340 样本量的平方根,在这里 0:00:59.340,0:01:02.320 是15,n的平方根。 0:01:02.320,0:01:03.570 他们问我们的是 0:01:03.570,0:01:05.760 什么是合适的临界值? 0:01:05.760,0:01:10.370 在这种情况下,我们应该使用的t星是什么? 0:01:10.370,0:01:13.620 我们要看的是t表, 0:01:13.620,0:01:16.890 而不是Z表,关键是要意识到 0:01:16.890,0:01:19.670 当我们在t表中寻找适当的临界值时, 0:01:19.670,0:01:23.090 有一个额外的变量需要考虑到, 0:01:23.090,0:01:27.340 那就是自由度的概念。 0:01:27.340,0:01:29.670 有时它被简写为df。 0:01:29.670,0:01:31.970 我不打算深入讨论自由度。 0:01:31.970,0:01:34.720 这实际上是一个相当深奥的概念。 0:01:34.720,0:01:36.880 但它是这样一个概念:你实际上会因为一些变量得到不同的t分布 0:01:36.880,0:01:40.670 取决于不同的样本大小, 0:01:40.670,0:01:42.540 取决于自由度。 0:01:42.540,0:01:44.990 而你的自由度是 0:01:44.990,0:01:47.490 你的样本量减去1。 0:01:47.490,0:01:50.060 在这种情况下,我们的自由度是 0:01:50.060,0:01:54.100 15减去1,所以我们的自由度 0:01:54.100,0:01:56.160 等于14。 0:01:56.160,0:01:58.450 这并不是我们第一次使用自由度。 0:01:58.450,0:02:00.530 我们在第一次谈及样本标准差时, 0:02:00.530,0:02:03.470 就谈到了自由度的问题, 0:02:03.470,0:02:05.210 以及如何对总体标准差 0:02:05.210,0:02:07.390 进行无偏估计。 0:02:07.390,0:02:09.840 在以后的视频中,我们将更加深入地探讨更多 0:02:09.840,0:02:12.080 关于自由度的话题,但就本例而言 0:02:12.080,0:02:14.640 在这个例子中,你只需要知道的是 0:02:14.640,0:02:17.380 当你在看一个给定自由度的t分布的时候, 0:02:17.380,0:02:19.640 你的自由度 0:02:19.640,0:02:21.490 是基于样本量的, 0:02:21.490,0:02:23.760 当我们考虑平均数的置信区间时, 0:02:23.760,0:02:26.280 你自由度是样本量减去1。 0:02:26.280,0:02:29.080 现在让我们来看看t表。 0:02:29.080,0:02:32.005 我们想要一个98%的置信区间 0:02:32.005,0:02:35.893 而且我们需要自由度为14。 0:02:36.890,0:02:40.010 让我们把T表拿出来, 0:02:40.010,0:02:41.940 我实际上是复制并粘贴了表的底部,并把它和顶部放在了一起, 0:02:41.940,0:02:43.650 所以你大致能看到整个表的内容。 0:02:43.650,0:02:45.300 这个T表的有用之处 0:02:45.300,0:02:47.300 是它在这里给出了我们的置信水平 0:02:47.300,0:02:50.450 所以如果你想要一个98%的置信水平, 0:02:50.450,0:02:53.020 你要看这一列。 0:02:53.020,0:02:55.580 你要看这里的这一列。 0:02:55.580,0:02:59.160 另一种思考关于98%的置信水平的方式是: 0:02:59.160,0:03:02.620 如果你有一个98%的置信水平, 0:03:02.620,0:03:07.230 这意味着你在分布的任何一端 0:03:07.230,0:03:09.680 都留下了1%的未填数据。 0:03:09.680,0:03:12.780 所以这时如果你看你的T分布,包括最左端的1%时, 0:03:12.780,0:03:16.620 你会想要找 0:03:16.620,0:03:21.450 尾部概率为0.01,你可能看不清楚。 0:03:21.450,0:03:23.040 让我换一个亮一点的颜色来标注, 0:03:23.040,0:03:25.820 这将是右边的尾部概率。 0:03:25.820,0:03:27.650 无论哪种思考方式,我们都需要看这一列。 0:03:27.650,0:03:30.080 我们的置信水平是98%。 0:03:30.080,0:03:32.330 记住,我们的自由度 0:03:32.330,0:03:37.193 我们的自由度在这里,我们的自由度为14。 0:03:37.193,0:03:41.613 我们要看一下这一行。 0:03:41.613,0:03:43.210 所以,你找到了。 0:03:43.210,0:03:46.333 这是我们的临界t值,2.624。 0:03:48.750,0:03:51.200 让我们回到选项。 0:03:51.200,0:03:56.200 2.264是这道题的选择。