大数定律
-
0:02 - 0:08我们来学习一下大数定律
-
0:08 - 0:12在数学和概率理论中
-
0:12 - 0:14它在很多层面上是最直观的定律之一
-
0:14 - 0:19但是因为它适用于很多情况
-
0:19 - 0:22却往往被误用或误解
-
0:22 - 0:26让我们用较为正式的数学方法
-
0:26 - 0:29先给出定义
-
0:29 - 0:29然后直观地讲
-
0:29 - 0:34比如说我有一个随机变量 X
-
0:34 - 0:39并且我们知道其期望值或其总体平均值
-
0:39 - 0:42大数定律只是说
-
0:42 - 0:46如果我们抽取随机变量的n个观测样本
-
0:46 - 0:49而且如果我们取它们的平均值
-
0:49 - 0:51让我定义另一个变量
-
0:51 - 0:54让我们叫它 X n 并在顶部加一横
-
0:54 - 0:57这就是随机变量的
-
0:57 - 0:58n 个观测值的均值
-
0:58 - 1:01它实际上是我第一次的观测
-
1:01 - 1:03所以你可以说我的一次试验
-
1:03 - 1:07我得到这一观测值 再次运行它 我又得到另一个观测值
-
1:07 - 1:12我继续运行它 n 次
-
1:12 - 1:13然后除以我观测的次数
-
1:13 - 1:14这就是我的样本平均值
-
1:14 - 1:17这是我做过的所有观测数据的平均值
-
1:17 - 1:23大数定律只是告诉我们这个样本平均值
-
1:23 - 1:28将趋近随机变量的期望值
-
1:28 - 1:33我也可以写成样本平均值将接近总体平均值
-
1:33 - 1:40当 n 接近无穷大时
-
1:40 - 1:43我会用非正式的方法来解释接近
-
1:43 - 1:44或趋近是什么意思?
-
1:44 - 1:46但我认为 你的直观会告诉你
-
1:46 - 1:50如果我有足够多的样本 最终
-
1:51 - 1:54我将得到总体的期望值
-
1:54 - 1:57对很多人来说 这很直观
-
1:57 - 2:02那如果我做足够多的实验 这些实验
-
2:02 - 2:04将给我所期望的数字
-
2:04 - 2:07鉴于期望值和概率等等
-
2:07 - 2:09但我认为人们经常有点误解
-
2:09 - 2:11为什么这会发生
-
2:11 - 2:13我继续之前 让我给你
-
2:13 - 2:15一个具体的例子
-
2:15 - 2:17大数定律将只是告诉我们— — 比如说
-
2:17 - 2:25有一个随机变量--X 等于正面的次数
-
2:25 - 2:31等于扔一个正常的硬币100 次后
-
2:31 - 2:33得到正面的次数
-
2:36 - 2:38首先 我们知道这个随机变量的
-
2:38 - 2:40期望值
-
2:40 - 2:43它是抛掷的次数或者试验的次数乘以
-
2:43 - 2:46任何试验的成功概率
-
2:46 - 2:49这就是等于 50
-
2:49 - 2:53所以大数定律只是说: 如果我取一个样本
-
2:53 - 2:58或者我取一些试验获得的样本的平均值
-
2:58 - 3:03所以你知道 我得到 — — 我第一次进行该试验时
-
3:03 - 3:06翻转 100 枚硬币或有100枚硬币放在鞋盒里
-
3:06 - 3:10我摇一摇鞋盒 并数正面的硬币 得到 55个
-
3:10 - 3:12这将是 X1
-
3:12 - 3:15然后我再次摇动鞋盒 得到 65
-
3:15 - 3:18然后我再次摇动鞋盒 得到 45
-
3:18 - 3:23我重复 n 次 然后除以
-
3:23 - 3:24我做的次数
-
3:24 - 3:27大数定律只告诉我们 这个平均数
-
3:27 - 3:31即我的所有观察的平均数
-
3:31 - 3:39当n趋近无穷大时 这个平均数将趋近50
-
3:39 - 3:41或 n 趋近 50
-
3:41 - 3:43抱歉 n趋近无穷大
-
3:43 - 3:45我想讲讲为什么出现这种情况
-
3:45 - 3:47或直觉为什么这样
-
3:47 - 3:51有很多人这样觉得 哦 这意味着
-
3:51 - 3:55如果100次试验后 我高于平均水平
-
3:55 - 3:58概率的规则要给我更多的正面
-
3:58 - 4:00或更少的正面以弥补差异
-
4:00 - 4:02事实上将不会这样
-
4:02 - 4:04那往往被称为一个赌徒的谬论
-
4:04 - 4:05让我区分开来
-
4:05 - 4:06我将用这个例子
-
4:06 - 4:08比如说 — — 让我画一个图
-
4:08 - 4:09我将换个颜色
-
4:23 - 4:25这是 n 我 x 轴是 n
-
4:25 - 4:28这是我试验的次数
-
4:28 - 4:33我的 y 轴 是我的样本平均值
-
4:33 - 4:36而我们知道期望值是什么
-
4:36 - 4:39我们知道此随机变量的期望值为 50
-
4:39 - 4:40让我在这里画一下
-
4:43 - 4:43这是 50
-
4:47 - 4:50看看我这个例子
-
4:50 - 4:54所以当 n 等于 — — 让我 [听不清]
-
4:54 - 4:55在这里
-
4:55 - 4:59第一次试验我得到55这就是我的平均值
-
4:59 - 5:01我只有一个数据点
-
5:01 - 5:05两项试验后 我得到 65
-
5:05 - 5:09所以我平均值将是 65 加 55 除以 2
-
5:09 - 5:10等于 60
-
5:10 - 5:13于是我平均值上升了一点
-
5:13 - 5:15第三次试验我得到45 这将使我平均值
-
5:15 - 5:17下降了一点
-
5:17 - 5:18我不会在这里绘制 45
-
5:18 - 5:19现在我要得出所有这些数的平均值
-
5:20 - 5:2245 加 65 是什么?
-
5:22 - 5:24让我来把数字理顺
-
5:24 - 5:25以便你能够理解
-
5:25 - 5:29所以 55 加 65
-
5:29 - 5:33等于120 然后加 45 等于 165
-
5:33 - 5:36除以 3
-
5:36 - 5:403 除165 5乘3 为 15
-
5:40 - 5:4253
-
5:42 - 5:44不 不 不
-
5:44 - 5:4555
-
5:45 - 5:47所以平均值降到 55
-
5:47 - 5:49我们可以继续做这些试验
-
5:49 - 5:52所以你可能会说 大数定律是这个意思
-
5:52 - 5:57好吧 我们做了 3 次试验和我们的平均值在那里
-
5:57 - 6:00所以很多人认为概率的神
-
6:00 - 6:02倾向于在未来使我们获得较少
-
6:02 - 6:03的正面
-
6:03 - 6:06那就是接下来的几项试验将不得不
-
6:06 - 6:09得到较低的数字 以便使我们的平均数下降
-
6:09 - 6:11其实并不一定如此
-
6:11 - 6:13往后的概率始终是相同的
-
6:13 - 6:15概率始终是50%
-
6:15 - 6:16去得到正面
-
6:16 - 6:20不是说如果我开头有一些正面
-
6:20 - 6:22或者开头正面多一些
-
6:22 - 6:25突然 情况得到补偿:我会得到较多的反面
-
6:25 - 6:28这是赌徒的谬论
-
6:28 - 6:30如果你有一长串正面或你有
-
6:30 - 6:32特别多的正面 在某个时刻
-
6:32 - 6:35你要有--你有更高的可能性
-
6:35 - 6:37得到特别多的反面
-
6:37 - 6:38这并不完全正确
-
6:38 - 6:41大数定律告诉我们的是它不管
-
6:41 - 6:46在一些有限次数的试验后
-
6:46 - 6:48你的平均数实际上--这种情况发生的可能性很低
-
6:48 - 6:50但比如说你的平均数在这里
-
6:50 - 6:52假设是 70
-
6:52 - 6:56你会说: 哇 我们
-
6:56 - 6:57偏离预期值好多
-
6:57 - 6:58但大数定律说什么 嗯
-
6:58 - 7:00我不关心已有多少次试验 因为
-
7:00 - 7:04我们还有无数次的试验
-
7:04 - 7:07这些无限次数试验的期望值
-
7:07 - 7:12尤其是在这种情况下将会这样
-
7:12 - 7:16所以 当你的有限次数的平均值
-
7:16 - 7:18高一些 然后你的无限次数的平均值
-
7:18 - 7:23将趋近于这个 随着时间推移 趋近并回到
-
7:23 - 7:24所期望的值
-
7:24 - 7:27上面是较为非正式的描述
-
7:27 - 7:30这就是大数定律试图告诉你的
-
7:30 - 7:31它很重要
-
7:31 - 7:34它并未告诉你 如果你已经得到了钱币的一些正面
-
7:34 - 7:36然后你得到反面的概率将会增加
-
7:36 - 7:38以弥补前面得到的正面
-
7:38 - 7:42它告诉你什么是 不管前面发生了什么
-
7:42 - 7:45在有限数量的试验下 无论怎样 平均是
-
7:45 - 7:47在有限数量的试验之后
-
7:47 - 7:48你还有无限次的试验
-
7:48 - 7:52如果你做了足够多次 它将趋近并回到
-
7:52 - 7:53它的期望值
-
7:53 - 7:54而这是需要思考的重要的事
-
7:54 - 7:58但这并不是每天在彩票和赌场中使用
-
7:58 - 8:02因为他们知道 如果你做足够多的样本
-
8:02 - 8:05我们能够计算出
-
8:05 - 8:08如果你做足够多的样本
-
8:08 - 8:10大大偏离的概率是什么?
-
8:10 - 8:13但赌场和彩票经营原理是这样
-
8:13 - 8:16如果你有足够的人
-
8:16 - 8:18短期内或通过几个样本
-
8:18 - 8:20个别人可能打败庄家
-
8:20 - 8:22但长期下来庄家总是会赢
-
8:22 - 8:24因为他们制定了赌博的参数
-
8:24 - 8:25然后让你玩
-
8:25 - 8:28不管怎么说 这在概率论中很重要
-
8:28 - 8:30我认为这相当直观
-
8:30 - 8:33虽然有时当你看到它的正式解释中
-
8:33 - 8:34像这个随机变量等等
-
8:34 - 8:35有点令人困惑
-
8:35 - 8:40所有这意思 当你采用越来越多的样本
-
8:40 - 8:45这些样本的平均值将会
-
8:45 - 8:46趋近真正的平均值
-
8:46 - 8:47或者我应该说得更特殊一点
-
8:47 - 8:52你的样本均值将要趋近于
-
8:52 - 8:55真正的总样本数的均值或
-
8:55 - 8:56随机变量的期望值
-
8:56 - 8:59无论怎样 下个视频再见
![]() |
Alex Mou edited Chinese, Simplified subtitles for Law of Large Numbers | |
![]() |
Alex Mou edited Chinese, Simplified subtitles for Law of Large Numbers | |
![]() |
Alex Mou edited Chinese, Simplified subtitles for Law of Large Numbers | |
![]() |
Simona Colapicchioni added a translation |