Law of Large Numbers
-
0:02 - 0:08我們來學習一下大數定律
-
0:08 - 0:12在數學和機率理論中
-
0:12 - 0:14它在很多層面上是最直觀的定律之一
-
0:14 - 0:19但是因爲它適用於很多情況
-
0:19 - 0:22卻往往被誤用或誤解
-
0:22 - 0:26讓我們用較爲正式的數學方法
-
0:26 - 0:29先給出定義
-
0:29 - 0:29然後直觀地講
-
0:29 - 0:34比如說我有一個隨機變數 X
-
0:34 - 0:39並且我們知道其預定值或其總體平均值
-
0:39 - 0:42大數定律只是說
-
0:42 - 0:46如果我們抽取隨機變數的n個觀測樣本
-
0:46 - 0:49而且如果我們取它們的平均值
-
0:49 - 0:51讓我定義另一個變量
-
0:51 - 0:54讓我們叫它 X n 並在頂部加一橫
-
0:54 - 0:57這就是隨機變數的
-
0:57 - 0:58n 個觀測值的均值
-
0:58 - 1:01它實際上是我第一次的觀測
-
1:01 - 1:03所以你可以說我的一次試驗
-
1:03 - 1:07我得到這一觀測值 再次運行它 我又得到另一個觀測值
-
1:07 - 1:12我繼續運行它 n 次
-
1:12 - 1:13然後除以我觀測的次數
-
1:13 - 1:14這就是我的樣本平均值
-
1:14 - 1:17這是我做過的所有觀測數據的平均值
-
1:17 - 1:23大數定律只是告訴我們這個樣本平均值
-
1:23 - 1:28將趨近隨機變數的預定值
-
1:28 - 1:33我也可以寫成樣本平均值將接近總體平均值
-
1:33 - 1:40當 n 接近無窮大時
-
1:40 - 1:43我會用非正式的方法來解釋接近
-
1:43 - 1:44或趨近是什麽意思?
-
1:44 - 1:46但我認爲 你的直觀會告訴你
-
1:46 - 1:50如果我有足夠多的樣本 最終
-
1:51 - 1:54我將得到總體的預定值
-
1:54 - 1:57對很多人來說 這很直觀
-
1:57 - 2:02那如果我做足夠多的實驗 這些實驗
-
2:02 - 2:04將給我所期望的數字
-
2:04 - 2:07鑒於預定值和機率等等
-
2:07 - 2:09但我認爲人們經常有點誤解
-
2:09 - 2:11爲什麽這會發生
-
2:11 - 2:13我繼續之前 讓我給你
-
2:13 - 2:15一個具體的例子
-
2:15 - 2:17大數定律將只是告訴我們— — 比如說
-
2:17 - 2:25有一個隨機變數--X 等於正面的次數
-
2:25 - 2:31等於扔一個正常的硬幣100 次後
-
2:31 - 2:33得到正面的次數
-
2:36 - 2:38首先 我們知道這個隨機變數的
-
2:38 - 2:40預定值
-
2:40 - 2:43它是抛擲的次數或者試驗的次數乘以
-
2:43 - 2:46任何試驗的成功機率
-
2:46 - 2:49這就是等於 50
-
2:49 - 2:53所以大數定律只是說: 如果我取一個樣本
-
2:53 - 2:58或者我取一些試驗獲得的樣本的平均值
-
2:58 - 3:03所以你知道 我得到 — — 我第一次進行該試驗時
-
3:03 - 3:06翻轉 100 枚硬幣或有100枚硬幣放在鞋盒裏
-
3:06 - 3:10我搖一搖鞋盒 並數正面的硬幣 得到 55個
-
3:10 - 3:12這將是 X1
-
3:12 - 3:15然後我再次搖動鞋盒 得到 65
-
3:15 - 3:18然後我再次搖動鞋盒 得到 45
-
3:18 - 3:23我重覆 n 次 然後除以
-
3:23 - 3:24我做的次數
-
3:24 - 3:27大數定律只告訴我們 這個平均數
-
3:27 - 3:31即我的所有觀察的平均數
-
3:31 - 3:39當n趨近無窮大時 這個平均數將趨近50
-
3:39 - 3:41或 n 趨近 50
-
3:41 - 3:43抱歉 n趨近無窮大
-
3:43 - 3:45我想講講爲什麽出現這種情況
-
3:45 - 3:47或直覺爲什麽這樣
-
3:47 - 3:51有很多人這樣覺得 哦 這意味著
-
3:51 - 3:55如果100次試驗後 我高於平均水平
-
3:55 - 3:58機率的規則要給我更多的正面
-
3:58 - 4:00或更少的正面以彌補差異
-
4:00 - 4:02事實上將不會這樣
-
4:02 - 4:04那往往被稱爲一個賭徒的謬論
-
4:04 - 4:05讓我區分開來
-
4:05 - 4:06我將用這個例子
-
4:06 - 4:08比如說 — — 讓我畫一個圖
-
4:08 - 4:09我將換個顏色
-
4:23 - 4:25這是 n 我 x 軸是 n
-
4:25 - 4:28這是我試驗的次數
-
4:28 - 4:33我的 y 軸 是我的樣本平均值
-
4:33 - 4:36而我們知道預定值是什麽
-
4:36 - 4:39我們知道此隨機變數的預定值爲 50
-
4:39 - 4:40讓我在這裡畫一下
-
4:43 - 4:43這是 50
-
4:47 - 4:50看看我這個例子
-
4:50 - 4:54所以當 n 等於 — — 讓我 [聽不清]
-
4:54 - 4:55在這裡
-
4:55 - 4:59第一次試驗我得到55這就是我的平均值
-
4:59 - 5:01我只有一個數據點
-
5:01 - 5:05兩項試驗後 我得到 65
-
5:05 - 5:09所以我平均值將是 65 加 55 除以 2
-
5:09 - 5:10等於 60
-
5:10 - 5:13於是我平均值擧升了一點
-
5:13 - 5:15第三次試驗我得到45 這將使我平均值
-
5:15 - 5:17下降了一點
-
5:17 - 5:18我不會在這裡繪制 45
-
5:18 - 5:19現在我要得出所有這些數的平均值
-
5:20 - 5:2245 加 65 是什麽?
-
5:22 - 5:24讓我來把數字理順
-
5:24 - 5:25以便你能夠理解
-
5:25 - 5:29所以 55 加 65
-
5:29 - 5:33等於120 然後加 45 等於 165
-
5:33 - 5:36除以 3
-
5:36 - 5:403 除165 5乘3 爲 15
-
5:40 - 5:4253
-
5:42 - 5:44不 不 不
-
5:44 - 5:4555
-
5:45 - 5:47所以平均值降到 55
-
5:47 - 5:49我們可以繼續做這些試驗
-
5:49 - 5:52所以你可能會說 大數定律是這個意思
-
5:52 - 5:57好吧 我們做了 3 次試驗和我們的平均值在那裏
-
5:57 - 6:00所以很多人認爲機率的神
-
6:00 - 6:02傾向於在未來使我們獲得較少
-
6:02 - 6:03的正面
-
6:03 - 6:06那就是接下來的幾項試驗將不得不
-
6:06 - 6:09得到較低的數字 以便使我們的平均數下降
-
6:09 - 6:11其實並不一定如此
-
6:11 - 6:13往後的機率始終是相同的
-
6:13 - 6:15機率始終是50%
-
6:15 - 6:16去得到正面
-
6:16 - 6:20不是說如果我開頭有一些正面
-
6:20 - 6:22或者開頭正面多一些
-
6:22 - 6:25突然 情況得到補償:我會得到較多的反面
-
6:25 - 6:28這是賭徒的謬論
-
6:28 - 6:30如果你有一長串正面或你有
-
6:30 - 6:32特別多的正面 在某個時刻
-
6:32 - 6:35你要有--你有更高的可能性
-
6:35 - 6:37得到特別多的反面
-
6:37 - 6:38這並不完全正確
-
6:38 - 6:41大數定律告訴我們的是它不管
-
6:41 - 6:46在一些有限次數的試驗後
-
6:46 - 6:48你的平均數實際上--這種情況發生的可能性很低
-
6:48 - 6:50但比如說你的平均數在這裡
-
6:50 - 6:52假設是 70
-
6:52 - 6:56你會說: 哇 我們
-
6:56 - 6:57偏離企望值好多
-
6:57 - 6:58但大數定律說什麽 嗯
-
6:58 - 7:00我不關心已有多少次試驗 因爲
-
7:00 - 7:04我們還有無數次的試驗
-
7:04 - 7:07這些無限次數試驗的預定值
-
7:07 - 7:12尤其是在這種情況下將會這樣
-
7:12 - 7:16所以 當你的有限次數的平均值
-
7:16 - 7:18高一些 然後你的無限次數的平均值
-
7:18 - 7:23將趨近於這個 隨著時間推移 趨近並回到
-
7:23 - 7:24所期望的值
-
7:24 - 7:27上面是較爲非正式的描述
-
7:27 - 7:30這就是大數定律試圖告訴你的
-
7:30 - 7:31它很重要
-
7:31 - 7:34它並未告訴你 如果你已經得到了錢幣的一些正面
-
7:34 - 7:36然後你得到反面的機率將會增加
-
7:36 - 7:38以彌補前面得到的正面
-
7:38 - 7:42它告訴你什麽是 不管前面發生了什麽
-
7:42 - 7:45在有限數量的試驗下 無論怎樣 平均是
-
7:45 - 7:47在有限數量的試驗之後
-
7:47 - 7:48你還有無限次的試驗
-
7:48 - 7:52如果你做了足夠多次 它將趨近並回到
-
7:52 - 7:53它的預定值
-
7:53 - 7:54而這是需要思考的重要的事
-
7:54 - 7:58但這並不是每天在彩票和賭場中使用
-
7:58 - 8:02因爲他們知道 如果你做足夠多的樣本
-
8:02 - 8:05我們能夠計算出
-
8:05 - 8:08如果你做足夠多的樣本
-
8:08 - 8:10大大偏離的機率是什麽?
-
8:10 - 8:13但賭場和彩票經營原理是這樣
-
8:13 - 8:16如果你有足夠的人
-
8:16 - 8:18短期內或通過幾個樣本
-
8:18 - 8:20個別人可能打敗莊家
-
8:20 - 8:22但長期下來莊家總是會贏
-
8:22 - 8:24因爲他們制定了賭博的參數
-
8:24 - 8:25然後讓你玩
-
8:25 - 8:28不管怎麽說 這在機率論中很重要
-
8:28 - 8:30我認爲這相當直觀
-
8:30 - 8:33雖然有時當你看到它的正式解釋中
-
8:33 - 8:34像這個隨機變數等等
-
8:34 - 8:35有點令人困惑
-
8:35 - 8:40所有這意思 當你采用越來越多的樣本
-
8:40 - 8:45這些樣本的平均值將會
-
8:45 - 8:46趨近真正的平均值
-
8:46 - 8:47或者我應該說得更特殊一點
-
8:47 - 8:52你的樣本平均數將要趨近於
-
8:52 - 8:55真正的總煤樣本數的均值或
-
8:55 - 8:56隨機變數的預定值
-
8:56 - 8:59無論怎樣 下個影片再見