样本比例抽样分布第二部分| AP统计|可汗学院
-
0:00 - 0:02这里
-
0:02 - 0:04是可汗学院上的便笺簿
-
0:04 - 0:08由可汗学院用户夏洛特·奥恩创建。
-
0:08 - 0:11你看到的是一个模拟
-
0:11 - 0:14它允许我们一直从口香糖球机器抽样
-
0:14 - 0:17并估计样本占比的
-
0:17 - 0:19抽样分布。
-
0:19 - 0:23她的模拟关注的是绿色的口香糖球,但我们之前讨论的
-
0:23 - 0:25是黄色的的口香糖球,我们讲的是
-
0:25 - 0:3160%的是黄色,让我们把这里的60%用绿色表示。
-
0:31 - 0:33抽一个大小为10的样本
-
0:33 - 0:35就像我们之前做的一样。
-
0:35 - 0:37先从一个样本开始
-
0:37 - 0:39取一个样本,我们想要展示的
-
0:39 - 0:40是百分比
-
0:40 - 0:43即每个样本中绿色球的占比
-
0:43 - 0:47如果我找第一个样本,在这10个之中
-
0:47 - 0:50五个是绿色的,在图上画出来
-
0:50 - 0:52在这里,小于50%
-
0:52 - 0:55我们的一个样本中50%是绿色的
-
0:55 - 0:59取另外一个样本,它有60%是绿色的。
-
0:59 - 1:02继续下去
-
1:02 - 1:03再取另一个样本
-
1:03 - 1:07我们得到一个有50%是绿色的样本
-
1:07 - 1:10注意这里的分布
-
1:10 - 1:13两个有50%的绿色。
-
1:13 - 1:16那么,我们能继续取样,
-
1:16 - 1:18让我们加快节奏
-
1:18 - 1:23我们要一次取50个大小为10的样本
-
1:23 - 1:25这样可以很快得到
-
1:25 - 1:27比较大量的样本。
-
1:27 - 1:29在这里有超过1000个样本
-
1:29 - 1:31有趣的是,
-
1:31 - 1:35从实验中看出我们的样本
-
1:35 - 1:37抽样占比的均值
-
1:37 - 1:39是0.62
-
1:39 - 1:42按几分钟前我们计算的,它应该是
-
1:42 - 1:430.6.
-
1:43 - 1:47我们还知道抽样占比的标准差
-
1:47 - 1:49是0.16
-
1:49 - 1:51我们计算的是大约
-
1:51 - 1:530.15
-
1:53 - 1:55随着样本数的增加,我们应该
-
1:55 - 1:58更接近这些值。
-
1:58 - 2:02可以看到,在大多数情况下,我们越来越接近了,
-
2:02 - 2:04事实上,四舍五入后
-
2:04 - 2:05我们刚好得出
-
2:05 - 2:08之前计算过的值。
-
2:08 - 2:10一个有趣的现象是,
-
2:10 - 2:14当总体占比不太接近于零时,
-
2:14 - 2:15并且不接近1
-
2:15 - 2:19很接近正态分布了。
-
2:19 - 2:20这说得通
-
2:20 - 2:22因为我们看到了
-
2:22 - 2:25抽样占比的分布和
-
2:25 - 2:28二项随机变数之间的关系。
-
2:28 - 2:32但是,如果总体占比接近于零呢?
-
2:32 - 2:36假设总体占比是10%
-
2:36 - 2:380.1
-
2:38 - 2:39你觉得分布
-
2:39 - 2:41会是什么样?
-
2:41 - 2:44我们知道抽样分布的均值
-
2:44 - 2:47将等于10%,所以你可以想象
-
2:47 - 2:49分布是右偏态的。
-
2:49 - 2:51我们来看看。
-
2:51 - 2:54这里我们看到的分布
-
2:54 - 2:56是右偏的。
-
2:57 - 2:59这是合理的。
-
2:59 - 3:02因为,你只能得到从0到1的值。
-
3:02 - 3:06如果你的均值接近0
-
3:06 - 3:08那你会看到分布主要在这边
-
3:08 - 3:10可以看到右边有长的尾巴。
-
3:10 - 3:12这就造成了右偏。
-
3:12 - 3:17如果总体比例接近1,
-
3:17 - 3:18你可以想象相反的情况会发生。
-
3:18 - 3:21结果会向左倾斜。
-
3:21 - 3:25我们可以看到,这里是左偏。
-
3:27 - 3:30另一件有趣的事是,
-
3:30 - 3:35样本越大,标准差越小。
-
3:35 - 3:38让我们做总量的分布
-
3:38 - 3:40在这里。
-
3:40 - 3:44这和我们之前看到的很相似,
-
3:44 - 3:47这看起来很正常。
-
3:47 - 3:49但现在,当样本容量为10时,
-
3:49 - 3:54但如果每次样本容量都是50呢?
-
3:54 - 3:59注意,现在分布更紧密了。
-
4:02 - 4:04这还没到1呢,
-
4:04 - 4:07但这是一个更紧密的分布。
-
4:07 - 4:10这是有意义的,样本标准差
-
4:10 - 4:14关于样本占比,是与n的平方根
-
4:14 - 4:16是成反比的。
-
4:16 - 4:17这就说得通了。
-
4:17 - 4:20希望你们对样本有了直观的理解,
-
4:20 - 4:23对于样本的占比,它的分布,
-
4:23 - 4:27关于抽样占比的样本分布,你可以计算它的平均数
-
4:27 - 4:30和它的标准方差。
-
4:30 - 4:31你感觉不错
-
4:31 - 4:33因为我们在模拟中见识过了。
- Title:
- 样本比例抽样分布第二部分| AP统计|可汗学院
- Description:
-
学习如何用模拟计算样本比例的分布。
练习该学科或者看更多相关课程
http://www.khanacademy.org/math/ap-statistics/sampling-distribution-ap/sampling-distribution-proportion/v/sampling-distribution-of-sample-proportion-part-2?utm_source=youtube&utm_medium=desc&utm_campaign=apstatistics可汗学院的AP统计:来认识一下我们的AP统计作者之一,杰夫。杰夫曾在密歇根州的卡拉马祖做过10年的高中教师,教代数1、几何、代数2、统计学入门和AP统计学。今天,他正在努力为AP统计学编写新的练习和文章。
可汗学院是一家非营利组织,其使命是为任何地方的任何人提供免费的世界级教育。 我们提供涵盖数学、生物、化学、物理、历史、经济、金融、语法、学前教育等多个学术领域的测验、习题、讲解视频及文章。我们为教师提供工具和数据等资源,让他们能够帮助学生培养出学业及未来成功所必需的技能、习惯和心态。 可汗学院已被翻译成数十种语言,在世界各地每个月都有一千五百万用户在可汗学院上进行学习。作为一家符合501(c)(3)条款的非营利组织,我们需要你的帮助!
成为捐赠人: https://www.khanacademy.org/donate?utm_source=youtube&utm_medium=desc
成为志愿者: https://www.khanacademy.org/contribute?utm_source=youtube&utm_medium=desc
- Video Language:
- English
- Team:
Khan Academy
- Duration:
- 04:34