1 00:00:00,190 --> 00:00:02,660 [讲师]我们被问到 2 00:00:02,660 --> 00:00:05,790 用于构建样本观测值为15的 3 00:00:05,790 --> 00:00:09,310 关于平均值的98%的置信区间时的 4 00:00:09,310 --> 00:00:14,170 临界值t星或t星号是多少? 5 00:00:14,170 --> 00:00:16,630 大概讲一下这里发生了什么, 6 00:00:16,630 --> 00:00:18,370 你有一个总体, 7 00:00:18,370 --> 00:00:19,580 这里有一个参数, 8 00:00:19,580 --> 00:00:21,410 我们叫它是总体平均数。 9 00:00:21,410 --> 00:00:24,970 我们不知道它是什么,所以我们抽取了一个样本。 10 00:00:24,970 --> 00:00:27,580 在这里,我们抽取了15个样本。 11 00:00:27,580 --> 00:00:30,990 所以n等于15,从这个样本中 12 00:00:30,990 --> 00:00:33,200 我们可以计算出一个样本平均数。 13 00:00:33,200 --> 00:00:36,340 但我们也要构建一个关于这个样本平均数 14 00:00:36,340 --> 00:00:38,010 98%的置信区间。 15 00:00:38,010 --> 00:00:39,880 我们要取这个样本的平均值 16 00:00:39,880 --> 00:00:42,800 然后再加上或减去一些误差范围。 17 00:00:42,800 --> 00:00:44,510 在其他视频中,我们已经讨论过 18 00:00:44,510 --> 00:00:46,690 在这里我们需要使用T分布 19 00:00:46,690 --> 00:00:49,850 因为我们不希望低估误差范围。 20 00:00:49,850 --> 00:00:52,665 所以是t星乘以 21 00:00:52,665 --> 00:00:56,200 样本标准差除以 22 00:00:56,200 --> 00:00:59,340 样本量的平方根,在这里 23 00:00:59,340 --> 00:01:02,320 是15,n的平方根。 24 00:01:02,320 --> 00:01:03,570 他们问我们的是 25 00:01:03,570 --> 00:01:05,760 什么是合适的临界值? 26 00:01:05,760 --> 00:01:10,370 在这种情况下,我们应该使用的t星是什么? 27 00:01:10,370 --> 00:01:13,620 我们要看的是t表, 28 00:01:13,620 --> 00:01:16,890 而不是Z表,关键是要意识到 29 00:01:16,890 --> 00:01:19,670 当我们在t表中寻找适当的临界值时, 30 00:01:19,670 --> 00:01:23,090 有一个额外的变量需要考虑到, 31 00:01:23,090 --> 00:01:27,340 那就是自由度的概念。 32 00:01:27,340 --> 00:01:29,670 有时它被简写为df。 33 00:01:29,670 --> 00:01:31,970 我不打算深入讨论自由度。 34 00:01:31,970 --> 00:01:34,720 这实际上是一个相当深奥的概念。 35 00:01:34,720 --> 00:01:36,880 但它是这样一个概念:你实际上会因为一些变量得到不同的t分布 36 00:01:36,880 --> 00:01:40,670 取决于不同的样本大小, 37 00:01:40,670 --> 00:01:42,540 取决于自由度。 38 00:01:42,540 --> 00:01:44,990 而你的自由度是 39 00:01:44,990 --> 00:01:47,490 你的样本量减去1。 40 00:01:47,490 --> 00:01:50,060 在这种情况下,我们的自由度是 41 00:01:50,060 --> 00:01:54,100 15减去1,所以我们的自由度 42 00:01:54,100 --> 00:01:56,160 等于14。 43 00:01:56,160 --> 00:01:58,450 这并不是我们第一次使用自由度。 44 00:01:58,450 --> 00:02:00,530 我们在第一次谈及样本标准差时, 45 00:02:00,530 --> 00:02:03,470 就谈到了自由度的问题, 46 00:02:03,470 --> 00:02:05,210 以及如何对总体标准差 47 00:02:05,210 --> 00:02:07,390 进行无偏估计。 48 00:02:07,390 --> 00:02:09,840 在以后的视频中,我们将更加深入地探讨更多 49 00:02:09,840 --> 00:02:12,080 关于自由度的话题,但就本例而言 50 00:02:12,080 --> 00:02:14,640 在这个例子中,你只需要知道的是 51 00:02:14,640 --> 00:02:17,380 当你在看一个给定自由度的t分布的时候, 52 00:02:17,380 --> 00:02:19,640 你的自由度 53 00:02:19,640 --> 00:02:21,490 是基于样本量的, 54 00:02:21,490 --> 00:02:23,760 当我们考虑平均数的置信区间时, 55 00:02:23,760 --> 00:02:26,280 你自由度是样本量减去1。 56 00:02:26,280 --> 00:02:29,080 现在让我们来看看t表。 57 00:02:29,080 --> 00:02:32,005 我们想要一个98%的置信区间 58 00:02:32,005 --> 00:02:35,893 而且我们需要自由度为14。 59 00:02:36,890 --> 00:02:40,010 让我们把T表拿出来, 60 00:02:40,010 --> 00:02:41,940 我实际上是复制并粘贴了表的底部,并把它和顶部放在了一起, 61 00:02:41,940 --> 00:02:43,650 所以你大致能看到整个表的内容。 62 00:02:43,650 --> 00:02:45,300 这个T表的有用之处 63 00:02:45,300 --> 00:02:47,300 是它在这里给出了我们的置信水平 64 00:02:47,300 --> 00:02:50,450 所以如果你想要一个98%的置信水平, 65 00:02:50,450 --> 00:02:53,020 你要看这一列。 66 00:02:53,020 --> 00:02:55,580 你要看这里的这一列。 67 00:02:55,580 --> 00:02:59,160 另一种思考关于98%的置信水平的方式是: 68 00:02:59,160 --> 00:03:02,620 如果你有一个98%的置信水平, 69 00:03:02,620 --> 00:03:07,230 这意味着你在分布的任何一端 70 00:03:07,230 --> 00:03:09,680 都留下了1%的未填数据。 71 00:03:09,680 --> 00:03:12,780 所以这时如果你看你的T分布,包括最左端的1%时, 72 00:03:12,780 --> 00:03:16,620 你会想要找 73 00:03:16,620 --> 00:03:21,450 尾部概率为0.01,你可能看不清楚。 74 00:03:21,450 --> 00:03:23,040 让我换一个亮一点的颜色来标注, 75 00:03:23,040 --> 00:03:25,820 这将是右边的尾部概率。 76 00:03:25,820 --> 00:03:27,650 无论哪种思考方式,我们都需要看这一列。 77 00:03:27,650 --> 00:03:30,080 我们的置信水平是98%。 78 00:03:30,080 --> 00:03:32,330 记住,我们的自由度 79 00:03:32,330 --> 00:03:37,193 我们的自由度在这里,我们的自由度为14。 80 00:03:37,193 --> 00:03:41,613 我们要看一下这一行。 81 00:03:41,613 --> 00:03:43,210 所以,你找到了。 82 00:03:43,210 --> 00:03:46,333 这是我们的临界t值,2.624。 83 00:03:48,750 --> 00:03:51,200 让我们回到选项。 84 00:03:51,200 --> 00:03:56,200 2.264是这道题的选择。