< Return to Video

Statistics: The Average

  • 0:01 - 0:03
    歡迎來到統計學課程
  • 0:03 - 0:06
    我早已盼望制作這套課程
  • 0:06 - 0:09
    好吧,我想要直搗黃龍地討論核心課程
  • 0:09 - 0:12
    我將盡量運用案例教學
  • 0:12 - 0:15
    以使大家對統計學有一個總體的理解
  • 0:15 - 0:17
    這樣是以防有人對統計學不熟悉
  • 0:17 - 0:19
    雖然,我想很多人直覺上了解統計學是什麽
  • 0:19 - 0:21
    雖然,我想很多人直覺上了解統計學是什麽
  • 0:22 - 0:27
    最核心的部分,好吧,概括而言,就是
  • 0:27 - 0:29
    一切圍繞數據進行
  • 0:29 - 0:31
    我們可以大體上爲統計學分類
  • 0:31 - 0:33
    基本可以分成三大類
  • 0:33 - 0:35
    第一種是敘述統計學
  • 0:35 - 0:39
    假設你有一大堆數據,你希望能在不把數據完全告訴別人
  • 0:39 - 0:41
    的情況下介紹這些數據的情況
  • 0:41 - 0:45
    你大概可以找到一些有標志性的數據
  • 0:45 - 0:48
    來代表所有的數據,而無需將所有的數據都說一次
  • 0:48 - 0:49
    來代表所有的數據,而無需將所有的數據都說一次
  • 0:49 - 0:50
    這就是敘述統計學
  • 0:50 - 0:52
    此外,還有一些統計學能對未來起預測作用
  • 0:52 - 0:53
    好吧,我大體把它們分成了一類
  • 0:53 - 0:55
    其中有推論統計學
  • 0:58 - 1:01
    推論統計學運用數據來對事物做結論
  • 1:01 - 1:02
    推論統計學運用數據來對事物做結論
  • 1:02 - 1:06
    假設你從總體中得到了一些樣本
  • 1:06 - 1:09
    統計學中經常提到樣本和總體
  • 1:09 - 1:11
    我想你應該對它們是什麽有一些基礎的認識,對麽?
  • 1:11 - 1:14
    假設我調查三個即將爲總統選舉投票的選民
  • 1:14 - 1:16
    很顯然我沒有調查整個總體
  • 1:16 - 1:18
    我僅僅調查了一個樣本
  • 1:18 - 1:22
    推論統計的妙處在於,我們只需對樣本
  • 1:22 - 1:25
    進行一些數學計算,便有可能推斷出
  • 1:25 - 1:28
    總體這個整體的情況
  • 1:28 - 1:30
    好吧,無論如何,我只是在對統計學是什麽進行概括介紹
  • 1:30 - 1:31
    好吧,無論如何,我只是在對統計學是什麽進行概括介紹
  • 1:31 - 1:34
    接下來,我們來學習統計學的核心內容,同時
  • 1:34 - 1:35
    我們將從描述統計開始學習
  • 1:38 - 1:41
    首先,如果別人給我們一組數據並且要求我們對其進行描述的話,我不知道我,或者大部分人會怎麽做
  • 1:41 - 1:44
    首先,如果別人給我們一組數據並且要求我們對其進行描述的話,我不知道我,或者大部分人會怎麽做
  • 1:44 - 1:47
    首先,如果別人給我們一組數據並且要求我們對其進行描述的話,我不知道我,或者大部分人會怎麽做
  • 1:47 - 1:51
    嗯,或許我會找到其中最能代表這一組數據的個別數字
  • 1:51 - 1:54
    嗯,或許我會找到其中最能代表這一組數據的個別數字
  • 1:54 - 1:57
    或者,一些能體現集中趨勢的數字
  • 1:57 - 2:00
    “集中趨勢” 是統計學課本上常見的詞
  • 2:00 - 2:03
    一組數字的集中趨勢
  • 2:07 - 2:09
    這也叫做平均數
  • 2:09 - 2:12
    在這裡,我使用“平均數”這個詞的時候會比平時更加精確一些
  • 2:12 - 2:16
    當我在這裡提到“平均數”時
  • 2:16 - 2:20
    它表示能描述一組數據的中心趨勢,即集中位置或平均水平的一個值
  • 2:20 - 2:23
    它表示能描述一組數據的中心趨勢,即集中位置或平均水平的一個值
  • 2:23 - 2:25
    或者說,最能代表一組數據的一個數值
  • 2:25 - 2:27
    我知道這聽起來非常抽象,但讓我們
  • 2:27 - 2:29
    先做幾道題吧
  • 2:29 - 2:32
    有幾種方法可以用來計算
  • 2:32 - 2:35
    一組數據的中心趨勢,或平均數
  • 2:35 - 2:38
    你以前或許見過這些
  • 2:38 - 2:41
    它們是均值(即平均數)
  • 2:41 - 2:43
    事實上,均值有很多種,我們這裡指的僅僅是
  • 2:43 - 2:44
    算數平均數
  • 2:51 - 2:54
    以後,當我們學習計算股票回報率時會學到幾何平均數
  • 2:54 - 2:55
    或許某天還會學到調和平均數
  • 2:55 - 3:03
    包括均值、中位數和眾數
  • 3:03 - 3:07
    用統計學的話說,這些都可用來表述一組數據
  • 3:07 - 3:11
    或是總體的集中趨勢
  • 3:11 - 3:13
    又或是樣本的集中趨勢
  • 3:13 - 3:16
    同時它們都是集合性的——它們都可能是平均數的某種形態
  • 3:16 - 3:17
    同時它們都是集合性的——它們都可能是平均數的某種形態
  • 3:17 - 3:19
    我想,當我們看到例子時
  • 3:19 - 3:19
    可能會更加明白
  • 3:19 - 3:23
    在日常生活中,當人們談論到平均數時
  • 3:23 - 3:26
    我想你在生活中已經計算過平均數了
  • 3:26 - 3:29
    人們通常指的是算數平均數
  • 3:29 - 3:30
    因此,通常情況下當人們說“讓我們計算這些數字的平均數”
  • 3:30 - 3:33
    人們希望你計算的是算數平均數
  • 3:33 - 3:34
    人們希望你計算的是算數平均數
  • 3:34 - 3:36
    他們不想要中位數或眾數
  • 3:36 - 3:39
    但在我們繼續向下學習之前,讓我們搞明白它們都是什麽
  • 3:39 - 3:41
    但在我們繼續向下學習之前,讓我們搞明白它們都是什麽
  • 3:41 - 3:43
    讓我來編造一組數字
  • 3:43 - 3:46
    假設我有1
  • 3:46 - 3:50
    假設我還有一個1、一個2、一個3
  • 3:50 - 3:53
    以及一個4
  • 3:53 - 3:55
    我想這些足夠了
  • 3:56 - 3:58
    我們只需要一個簡單的例子
  • 3:58 - 4:03
    當談到平均數時,算數平均數或許是大家最熟悉的
  • 4:03 - 4:06
    當談到平均數時,算數平均數或許是大家最熟悉的
  • 4:06 - 4:08
    基本上你只需將所有數字相加,然後
  • 4:08 - 4:09
    除以數字的數目
  • 4:09 - 4:16
    在這個例子中,5個數的和就是1加1加2加3加4
  • 4:16 - 4:19
    然後除以5
  • 4:19 - 4:21
    然後除以5
  • 4:21 - 4:22
    結果是多少呢?
  • 4:22 - 4:23
    1加1等於2
  • 4:23 - 4:26
    2加2等於4
  • 4:26 - 4:28
    4加3等於7
  • 4:28 - 4:30
    7加4等於11
  • 4:30 - 4:33
    結果等於11除以5
  • 4:33 - 4:33
    就是?
  • 4:33 - 4:34
    二又五分之一
  • 4:34 - 4:38
    就等於2.2
  • 4:38 - 4:40
    所以,有人會說:“嘿,你知道
  • 4:40 - 4:41
    這個數字相當不錯地代表了這組數據。”
  • 4:41 - 4:42
    這個數字相當不錯地代表了這組數據。
  • 4:42 - 4:45
    這組數據中所有的數字和2.2都比較接近。”
  • 4:45 - 4:47
    你也可以認爲,2.2代表了這組數據的集中趨勢
  • 4:47 - 4:49
    你也可以認爲,2.2代表了這組數據的集中趨勢
  • 4:49 - 4:51
    通常說來,這將會是平均數。
  • 4:51 - 4:53
    更加精確地說,這是這組數據的算術平均數
  • 4:53 - 4:55
    更加精確地說,這是這組數據的算術平均數
  • 4:55 - 4:57
    你可以看到,它對這組數有一定的代表性
  • 4:57 - 4:59
    如果我不想告訴你這5個數字分別是什麽
  • 4:59 - 5:01
    我可以說:“你知道,我有一組5個數據,而且
  • 5:01 - 5:04
    它們的均值是2.2。”這樣至少告訴了你
  • 5:04 - 5:06
    這組數字大概會是怎樣的
  • 5:06 - 5:09
    大概在下一個影片裏,我們會談到如何知道均值和
  • 5:09 - 5:12
    這組數據中每個數字的差是多少
  • 5:12 - 5:14
    所以,這就是其中一種衡量方法
  • 5:14 - 5:17
    除了這樣計算平均數外,另一種衡量方法
  • 5:17 - 5:20
    就是把這組數按順序排好
  • 5:20 - 5:20
    事實上我就是這麽做的
  • 5:20 - 5:23
    讓我們再次將這組數字從小到大排列
  • 5:23 - 5:27
    1,1,2,3,4
  • 5:27 - 5:28
    取中間的數字
  • 5:28 - 5:32
    我們看看,這裡有1、2、3、4、5個數
  • 5:32 - 5:34
    所以中間的就是第三個數,對嗎?
  • 5:34 - 5:35
    中間的數字是2
  • 5:35 - 5:37
    這組數據中,有兩個比2大,還有
  • 5:37 - 5:39
    兩個比2小
  • 5:39 - 5:40
    2就被稱爲中位數
  • 5:40 - 5:42
    所以,中位數涉及的計算非常少
  • 5:42 - 5:43
    事實上你只需將數字排序
  • 5:43 - 5:46
    然後你找到中間的數,比這個數大和比這個
  • 5:46 - 5:48
    數小的數字在這個組裏一樣多
  • 5:48 - 5:51
    所以這組數據的中位數就是2
  • 5:51 - 5:53
    你看,我指的是,這個中位數
  • 5:53 - 5:54
    和均值其實挺相近的
  • 5:54 - 5:56
    沒有唯一正確的答案
  • 5:56 - 5:59
    均值和中位數都不是衡量平均數的唯一答案
  • 5:59 - 6:02
    它們只是衡量平均數的不同方法
  • 6:02 - 6:05
    這裡就是中位數
  • 6:05 - 6:07
    我知道你大概在想:“好吧,當我們
  • 6:07 - 6:09
    有5個數的時候這些都很簡單
  • 6:09 - 6:12
    但如果我們有6個數字呢?”那該怎麽辦呢?
  • 6:12 - 6:14
    如果這組數中有6個數怎麽辦?
  • 6:14 - 6:20
    1,1,2,3,4,讓我們再加一個4
  • 6:20 - 6:22
    所以,我們現在沒有中間的數字了,對麽?
  • 6:22 - 6:25
    2不再是中位數,因爲有2個數比它小
  • 6:25 - 6:27
    3個數比它大
  • 6:27 - 6:29
    3也不是中位數,因爲組裏有3個數比它大
  • 6:29 - 6:32
    不好意思,我說錯了,有2個數比它大,3個數
  • 6:32 - 6:33
    比它小
  • 6:33 - 6:34
    所以沒有數字在中間
  • 6:34 - 6:36
    當一組數據的個數是偶數,且要求你算出中位數
  • 6:36 - 6:38
    你所需要做的就是取中間的兩個數字
  • 6:38 - 6:44
    然後計算這兩個數字的算術平均數
  • 6:44 - 6:45
    然後計算這兩個數字的算術平均數
  • 6:45 - 6:51
    因此,在這組數字中,中位數是2.5
  • 6:51 - 6:52
    好吧
  • 6:52 - 6:54
    但我們先不討論這個,因爲我想比較一下同組數據的
  • 6:54 - 6:57
    中位數、均值和眾數之間的區別
  • 6:57 - 6:58
    中位數、均值和眾數之間的區別
  • 6:58 - 7:00
    知道這個有助於學習,因爲這三者容易讓人混淆
  • 7:00 - 7:01
    知道這個有助於學習,因爲這三者容易讓人混淆
  • 7:01 - 7:04
    而且,這三個都是數學定義
  • 7:04 - 7:06
    是爲了讓我們更好的分析數字,可供運用的數學工具
  • 7:06 - 7:08
    是爲了讓我們更好的分析數字,可供運用的數學工具
  • 7:08 - 7:12
    這些計算公式並不會某天出現在天空,讓人們
  • 7:12 - 7:14
    驚呼:“哦,如何計算平均數是宇宙的部分奧秘!”
  • 7:14 - 7:17
    驚呼:“哦,如何計算平均數是宇宙的部分奧秘!”
  • 7:17 - 7:20
    這些計算都是人類創造出來,以便使我們的大腦
  • 7:20 - 7:22
    能更好地處理數據
  • 7:22 - 7:25
    這組數據數目不多,但如果我們擁有的不是5個
  • 7:25 - 7:27
    數而是五百萬個,你可以想象,你絕對不會願意
  • 7:27 - 7:29
    一個一個地去分析這些數字
  • 7:29 - 7:32
    無論如何,在我進一步討論前,我們先學習一下眾數的概念
  • 7:32 - 7:33
    無論如何,在我進一步討論前,我們先學習一下眾數的概念
  • 7:33 - 7:36
    在一定程度上,我認爲眾數是最容易被人遺忘的
  • 7:36 - 7:40
    人們通常在考試時看到眾數時總會驚訝萬分
  • 7:40 - 7:42
    他們會覺得:“哦,這是一個很高深的概念!”
  • 7:42 - 7:45
    而事實上,眾數在一定程度上是計算集中趨勢或是平均數
  • 7:45 - 7:49
    最簡單的方法
  • 7:49 - 7:54
    眾數就是一組數據中最經常出現的數
  • 7:54 - 7:56
    在這個例子裏,有兩個1,其他的數字都各自只有一個,對嗎?
  • 7:56 - 7:58
    在這個例子裏,有兩個1,其他的數字都各自只有一個,對嗎?
  • 7:58 - 8:00
    所以,這裡的眾數就是1
  • 8:00 - 8:03
    因此,眾數就是最多的數
  • 8:03 - 8:05
    現在,你可能會說:“哇,Sal,如果這個是我們的數組怎麽辦?
  • 8:05 - 8:06
    現在,你可能會說:“哇,Sal,如果這個是我們的數組怎麽辦?
  • 8:06 - 8:12
    1,1,2,3,4,4。” 這裡,有兩個1,還有兩個4
  • 8:12 - 8:14
    在這種情況下,計算眾數就更困難一點
  • 8:14 - 8:18
    因爲1和4都可能成爲眾數
  • 8:18 - 8:20
    你可以說眾數是1,或者眾數是4
  • 8:20 - 8:23
    但是這樣都不夠精確
  • 8:23 - 8:25
    可能你會需要讓那個問你問題的人澄清一下他的意圖
  • 8:25 - 8:26
    可能你會需要讓那個問你問題的人澄清一下他的意圖
  • 8:26 - 8:29
    大部分時候,如果你在考試時遇到這個問題時
  • 8:29 - 8:29
    答案都不會這麽模糊
  • 8:29 - 8:33
    通常一組數據中會有一個最經常出現的數字
  • 8:33 - 8:36
    現在,你可能會問,好吧,爲什麽一種計算方法還不夠
  • 8:36 - 8:37
    現在,你可能會問,好吧,爲什麽一種計算方法還不夠
  • 8:37 - 8:38
    你知道我們學習平均數的目的,爲什麽我們不干脆僅僅使用平均數呢?
  • 8:38 - 8:40
    你知道我們學習平均數的目的,爲什麽我們不干脆僅僅使用平均數呢?
  • 8:40 - 8:43
    又或者,爲什麽我們不一直用算術平均數進行計算呢?
  • 8:43 - 8:45
    中位數和眾數有什麽用呢?
  • 8:45 - 8:48
    好吧,我將試著舉一個例子,看看你明不明白
  • 8:48 - 8:51
    好吧,我將試著舉一個例子,看看你明不明白
  • 8:51 - 8:52
    然後你可以自己進一步思考一下
  • 8:52 - 8:54
    假設我有這樣一組數
  • 8:54 - 9:04
    3,3,3,3,3,以及,100
  • 9:04 - 9:09
    那麽,算術平均數是多少?
  • 9:09 - 9:12
    我有5個3以及1個100
  • 9:12 - 9:17
    所以答案是用115除以6,對嗎
  • 9:17 - 9:20
    我有六個數
  • 9:20 - 9:22
    115只是這六個數的和
  • 9:22 - 9:27
    所以結果是:115是6的多少倍?
  • 9:27 - 9:29
    上一
  • 9:29 - 9:31
    一六得六
  • 9:31 - 9:32
    55除以6,上9
  • 9:32 - 9:34
    六九五十四
  • 9:34 - 9:36
    所以答案是19又1/6
  • 9:37 - 9:38
    好吧
  • 9:39 - 9:41
    我僅僅將所有數相加然後除以個數
  • 9:41 - 9:42
    我僅僅將所有數相加然後除以個數
  • 9:42 - 9:45
    但是我的問題是,這個答案真的能代表這組變量麽
  • 9:45 - 9:46
    但是我的問題是,這個答案真的能代表這組變量麽
  • 9:46 - 9:48
    我的意思是,我有很多的3,只有一個100
  • 9:48 - 9:51
    但是,我們得到的集中趨勢卻是19又1/6
  • 9:51 - 9:54
    我的意思是,19又1/6並不能很好地代表這組數據的情況
  • 9:54 - 9:54
    我的意思是,19又1/6並不能很好地代表這組數據的情況
  • 9:54 - 9:56
    或許在不同的問題下,這個答案是正確的
  • 9:56 - 9:58
    但是看起來還是有點怪,對不對?
  • 9:58 - 10:00
    我覺得,我的直覺告訴我,集中趨勢應該是一個更靠近3的數字
  • 10:00 - 10:03
    因爲組裏有很多的3
  • 10:03 - 10:07
    在這裡,眾數會告訴我們什麽呢?
  • 10:07 - 10:10
    這些數字已經是從小到大排列的,對嗎?
  • 10:10 - 10:11
    如果它們是隨機給出的,你首先需要將其從小到大排列
  • 10:11 - 10:13
    然後你看看,中間的那個數是什麽?
  • 10:13 - 10:16
    我們看看,因爲這組數的數目是偶數,中間的兩個數是3和3
  • 10:16 - 10:18
    我們看看,因爲這組數的數目是偶數,中間的兩個數是3和3
  • 10:18 - 10:21
    3和3的平均數——我應該說得更加精確
  • 10:21 - 10:22
    3和3的平均數——我應該說得更加精確
  • 10:22 - 10:27
    計算3和3的算術平均數,答案是3
  • 10:27 - 10:30
    這個數字可能是衡量這組數字的
  • 10:30 - 10:34
    集中趨勢或是平均數更加準確的指標,對嗎?
  • 10:34 - 10:38
    根本上說,使用中位數計算時,我不會受到組裏
  • 10:38 - 10:41
    比其他數大很多、很不一樣的數字的影響
  • 10:41 - 10:42
    比其他數大很多、很不一樣的數字的影響
  • 10:42 - 10:44
    在統計學上,它們被稱爲不具代表性的異常值(溢出值)
  • 10:44 - 10:47
    舉例說明這樣的數字,假設當我們談起平均房價時
  • 10:47 - 10:52
    這個城市的房子大概都是10萬美金
  • 10:52 - 10:54
    但是,其中卻有一棟房子價值1000億美金
  • 10:54 - 10:56
    如果某人告訴你,假設,平均房價是1百萬美金
  • 10:56 - 10:58
    你對這個城市可能會有十分錯誤的印象
  • 10:58 - 11:00
    你對這個城市可能會有十分錯誤的印象
  • 11:00 - 11:04
    但是,如果告訴你房價的中位數是10萬美金,那麽
  • 11:04 - 11:06
    你對這個城市的真實房價就會有更好的了解
  • 11:06 - 11:09
    類似地,這個中位數,可能會給你關於這組數據
  • 11:09 - 11:12
    具體情況如何的更好的解釋
  • 11:12 - 11:16
    因爲算術平均數受到異常值的影響,有所偏離
  • 11:16 - 11:18
    因爲算術平均數受到異常值的影響,有所偏離
  • 11:18 - 11:20
    同時,要能夠找到這個異常值
  • 11:20 - 11:22
    一個統計學家可能會說,一看到它我就知道是它
  • 11:22 - 11:23
    一個統計學家可能會說,一看到它我就知道是它
  • 11:23 - 11:25
    對於異常值並沒有一個正式的定義
  • 11:25 - 11:28
    但是異常值通常是一個明顯地與其他數字不同的數
  • 11:28 - 11:31
    有時候,異常值的産生是來源於衡量錯誤或其他原因
  • 11:31 - 11:33
    最後,讓我們討論眾數
  • 11:33 - 11:35
    這組數中最多見的數字是什麽?
  • 11:35 - 11:39
    組裏有5個3和一個100
  • 11:39 - 11:41
    所以,最常見的數字,再一次是3
  • 11:41 - 11:45
    在這個例子裏,當你有一個異常值的時候,中位數
  • 11:45 - 11:47
    和眾數可能,你知道,可能是用來描述一組變量
  • 11:47 - 11:51
    更加合適的指標
  • 11:51 - 11:52
    更加合適的指標
  • 11:52 - 11:53
    可能這只是一種度量錯誤
  • 11:53 - 11:54
    但是我不知道,我們並不了解實際上這些代表什麽
  • 11:54 - 11:55
    但是我不知道,我們並不了解實際上這些代表什麽
  • 11:55 - 11:58
    如果這些是房價的話,我可能會認爲說這些更能
  • 11:58 - 12:01
    代表這個地區真實的房價情況
  • 12:01 - 12:03
    代表這個地區真實的房價情況
  • 12:03 - 12:06
    但如果這些數字是其他情況的產物,例如是一次考試的成績
  • 12:06 - 12:08
    那麽,可能,班上有一個孩子
  • 12:08 - 12:10
    六個孩子中有一個學得非常非常好,而且其他孩子都不學習
  • 12:10 - 12:10
    六個孩子中有一個學得非常非常好,而且其他孩子都不學習
  • 12:10 - 12:14
    這個更能表明,一定程度上,在這個層次的學生平均水平如何
  • 12:14 - 12:15
    這個更能表明,一定程度上,在這個層次的學生平均水平如何
  • 12:15 - 12:18
    無論如何,我這次的內容就講到這裡
  • 12:18 - 12:20
    我希望你們多和數字做遊戲,同時
  • 12:20 - 12:21
    獨自思考一下這些概念
  • 12:21 - 12:25
    在下一個影片中,我們將會學到更多
  • 12:25 - 12:25
    敘述統計學的內容
  • 12:25 - 12:28
    我們不再談論集中趨勢,而是談論
  • 12:28 - 12:30
    集中趨勢外數字的離散程度
  • 12:30 - 12:32
    集中趨勢外數字的離散程度
  • 12:32 - 12:33
    下次見!
Title:
Statistics: The Average
Description:

Introduction to descriptive statistics and central tendency. Ways to measure the average of a set: median, mean, mode

more » « less
Video Language:
English
Duration:
12:35
David Chiu added a translation

Chinese, Traditional subtitles

Revisions