< Return to Video

样本比例抽样分布第二部分| AP统计|可汗学院

  • 0:00 - 0:02
    这里
  • 0:02 - 0:04
    是可汗学院上的便笺簿
  • 0:04 - 0:08
    由可汗学院用户夏洛特·奥恩创建。
  • 0:08 - 0:11
    你看到的是一个模拟
  • 0:11 - 0:14
    它允许我们一直从口香糖球机器抽样
  • 0:14 - 0:17
    并估计样本占比的
  • 0:17 - 0:19
    抽样分布。
  • 0:19 - 0:23
    她的模拟关注的是绿色的口香糖球,但我们之前讨论的
  • 0:23 - 0:25
    是黄色的的口香糖球,我们讲的是
  • 0:25 - 0:31
    60%的是黄色,让我们把这里的60%用绿色表示。
  • 0:31 - 0:33
    抽一个大小为10的样本
  • 0:33 - 0:35
    就像我们之前做的一样。
  • 0:35 - 0:37
    先从一个样本开始
  • 0:37 - 0:39
    取一个样本,我们想要展示的
  • 0:39 - 0:40
    是百分比
  • 0:40 - 0:43
    即每个样本中绿色球的占比
  • 0:43 - 0:47
    如果我找第一个样本,在这10个之中
  • 0:47 - 0:50
    五个是绿色的,在图上画出来
  • 0:50 - 0:52
    在这里,小于50%
  • 0:52 - 0:55
    我们的一个样本中50%是绿色的
  • 0:55 - 0:59
    取另外一个样本,它有60%是绿色的。
  • 0:59 - 1:02
    继续下去
  • 1:02 - 1:03
    再取另一个样本
  • 1:03 - 1:07
    我们得到一个有50%是绿色的样本
  • 1:07 - 1:10
    注意这里的分布
  • 1:10 - 1:13
    两个有50%的绿色。
  • 1:13 - 1:16
    那么,我们能继续取样,
  • 1:16 - 1:18
    让我们加快节奏
  • 1:18 - 1:23
    我们要一次取50个大小为10的样本
  • 1:23 - 1:25
    这样可以很快得到
  • 1:25 - 1:27
    比较大量的样本。
  • 1:27 - 1:29
    在这里有超过1000个样本
  • 1:29 - 1:31
    有趣的是,
  • 1:31 - 1:35
    从实验中看出我们的样本
  • 1:35 - 1:37
    抽样占比的均值
  • 1:37 - 1:39
    是0.62
  • 1:39 - 1:42
    按几分钟前我们计算的,它应该是
  • 1:42 - 1:43
    0.6.
  • 1:43 - 1:47
    我们还知道抽样占比的标准差
  • 1:47 - 1:49
    是0.16
  • 1:49 - 1:51
    我们计算的是大约
  • 1:51 - 1:53
    0.15
  • 1:53 - 1:55
    随着样本数的增加,我们应该
  • 1:55 - 1:58
    更接近这些值。
  • 1:58 - 2:02
    可以看到,在大多数情况下,我们越来越接近了,
  • 2:02 - 2:04
    事实上,四舍五入后
  • 2:04 - 2:05
    我们刚好得出
  • 2:05 - 2:08
    之前计算过的值。
  • 2:08 - 2:10
    一个有趣的现象是,
  • 2:10 - 2:14
    当总体占比不太接近于零时,
  • 2:14 - 2:15
    并且不接近1
  • 2:15 - 2:19
    很接近正态分布了。
  • 2:19 - 2:20
    这说得通
  • 2:20 - 2:22
    因为我们看到了
  • 2:22 - 2:25
    抽样占比的分布和
  • 2:25 - 2:28
    二项随机变数之间的关系。
  • 2:28 - 2:32
    但是,如果总体占比接近于零呢?
  • 2:32 - 2:36
    假设总体占比是10%
  • 2:36 - 2:38
    0.1
  • 2:38 - 2:39
    你觉得分布
  • 2:39 - 2:41
    会是什么样?
  • 2:41 - 2:44
    我们知道抽样分布的均值
  • 2:44 - 2:47
    将等于10%,所以你可以想象
  • 2:47 - 2:49
    分布是右偏态的。
  • 2:49 - 2:51
    我们来看看。
  • 2:51 - 2:54
    这里我们看到的分布
  • 2:54 - 2:56
    是右偏的。
  • 2:57 - 2:59
    这是合理的。
  • 2:59 - 3:02
    因为,你只能得到从0到1的值。
  • 3:02 - 3:06
    如果你的均值接近0
  • 3:06 - 3:08
    那你会看到分布主要在这边
  • 3:08 - 3:10
    可以看到右边有长的尾巴。
  • 3:10 - 3:12
    这就造成了右偏。
  • 3:12 - 3:17
    如果总体比例接近1,
  • 3:17 - 3:18
    你可以想象相反的情况会发生。
  • 3:18 - 3:21
    结果会向左倾斜。
  • 3:21 - 3:25
    我们可以看到,这里是左偏。
  • 3:27 - 3:30
    另一件有趣的事是,
  • 3:30 - 3:35
    样本越大,标准差越小。
  • 3:35 - 3:38
    让我们做总量的分布
  • 3:38 - 3:40
    在这里。
  • 3:40 - 3:44
    这和我们之前看到的很相似,
  • 3:44 - 3:47
    这看起来很正常。
  • 3:47 - 3:49
    但现在,当样本容量为10时,
  • 3:49 - 3:54
    但如果每次样本容量都是50呢?
  • 3:54 - 3:59
    注意,现在分布更紧密了。
  • 4:02 - 4:04
    这还没到1呢,
  • 4:04 - 4:07
    但这是一个更紧密的分布。
  • 4:07 - 4:10
    这是有意义的,样本标准差
  • 4:10 - 4:14
    关于样本占比,是与n的平方根
  • 4:14 - 4:16
    是成反比的。
  • 4:16 - 4:17
    这就说得通了。
  • 4:17 - 4:20
    希望你们对样本有了直观的理解,
  • 4:20 - 4:23
    对于样本的占比,它的分布,
  • 4:23 - 4:27
    关于抽样占比的样本分布,你可以计算它的平均数
  • 4:27 - 4:30
    和它的标准方差。
  • 4:30 - 4:31
    你感觉不错
  • 4:31 - 4:33
    因为我们在模拟中见识过了。
Title:
样本比例抽样分布第二部分| AP统计|可汗学院
Description:

学习如何用模拟计算样本比例的分布。

练习该学科或者看更多相关课程
http://www.khanacademy.org/math/ap-statistics/sampling-distribution-ap/sampling-distribution-proportion/v/sampling-distribution-of-sample-proportion-part-2?utm_source=youtube&utm_medium=desc&utm_campaign=apstatistics

可汗学院的AP统计:来认识一下我们的AP统计作者之一,杰夫。杰夫曾在密歇根州的卡拉马祖做过10年的高中教师,教代数1、几何、代数2、统计学入门和AP统计学。今天,他正在努力为AP统计学编写新的练习和文章。

可汗学院是一家非营利组织,其使命是为任何地方的任何人提供免费的世界级教育。 我们提供涵盖数学、生物、化学、物理、历史、经济、金融、语法、学前教育等多个学术领域的测验、习题、讲解视频及文章。我们为教师提供工具和数据等资源,让他们能够帮助学生培养出学业及未来成功所必需的技能、习惯和心态。 可汗学院已被翻译成数十种语言,在世界各地每个月都有一千五百万用户在可汗学院上进行学习。作为一家符合501(c)(3)条款的非营利组织,我们需要你的帮助!

成为捐赠人: https://www.khanacademy.org/donate?utm_source=youtube&utm_medium=desc

成为志愿者: https://www.khanacademy.org/contribute?utm_source=youtube&utm_medium=desc

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
04:34

Chinese, Simplified subtitles

Revisions Compare revisions