1 00:00:00,190 --> 00:00:02,660 Đề bảo mình tìm giá trị tới hạn 2 00:00:02,660 --> 00:00:05,790 t sao cần thiết để dựng 3 00:00:05,790 --> 00:00:09,310 khoảng tin cậy 98% cho trung bình 4 00:00:09,310 --> 00:00:14,170 của cỡ mẫu n bằng 15 quan sát. 5 00:00:14,170 --> 00:00:16,630 Đầu tiên mình tóm tắt đề ha, 6 00:00:16,630 --> 00:00:18,370 mình có tổng thể đây, và 7 00:00:18,370 --> 00:00:19,580 cho tham số là 8 00:00:19,580 --> 00:00:21,410 số bình quân của tổng thể chung. 9 00:00:21,410 --> 00:00:24,970 Mình không biết cái này là gì, nên mình sẽ lấy mẫu thống kê, 10 00:00:24,970 --> 00:00:27,580 có cỡ mẫu là 15, 11 00:00:27,580 --> 00:00:30,990 vậy n bằng 15, rồi từ mẫu đó 12 00:00:30,990 --> 00:00:33,200 mình tính trung bình mẫu. 13 00:00:33,200 --> 00:00:36,340 Rồi mình cũng muốn dựng một khoảng tin cậy 98% 14 00:00:36,340 --> 00:00:38,010 cho trung bình mẫu đó. 15 00:00:38,010 --> 00:00:39,880 Vậy mình sẽ tính trung bình mẫu 16 00:00:39,880 --> 00:00:42,800 và rồi cộng hoặc trừ biên độ sai số. 17 00:00:42,800 --> 00:00:44,510 Ở các videos trước, mình 18 00:00:44,510 --> 00:00:46,690 nói mình muốn dùng phân phối t 19 00:00:46,690 --> 00:00:49,850 vì mình không muốn đánh giá thấp biên độ sai số, 20 00:00:49,850 --> 00:00:52,665 vậy nó sẽ là t sao nhân 21 00:00:52,665 --> 00:00:56,200 độ lệch chuẩn của mẫu, tất cả chia 22 00:00:56,200 --> 00:00:59,340 căn bậc hai của cỡ mẫu, trong trường hợp này 23 00:00:59,340 --> 00:01:02,320 là 15, vậy căn bậc hai của n. 24 00:01:02,320 --> 00:01:03,570 Giờ đề đang hỏi mình tìm 25 00:01:03,570 --> 00:01:05,760 giá trị tới hạn phù hợp. 26 00:01:05,760 --> 00:01:10,370 Vậy t sao nào phù hợp trong trường hợp này đây? 27 00:01:10,370 --> 00:01:13,620 Mình sẽ nhìn vào bảng z, hay chắc mình gọi nó là 28 00:01:13,620 --> 00:01:16,890 bảng t, nhưng điều quan trọng là mình có 29 00:01:16,890 --> 00:01:19,670 một biến số nữa cần lưu ý 30 00:01:19,670 --> 00:01:22,230 khi tìm giá trị tới hạn phù hợp 31 00:01:22,230 --> 00:01:27,340 trên bảng t, và đó chính là khái niệm của bậc tự do, 32 00:01:27,340 --> 00:01:29,670 đôi lúc được viết tắt thành df. 33 00:01:29,670 --> 00:01:31,970 Mình sẽ không nói sâu về bậc tự do, 34 00:01:31,970 --> 00:01:34,720 nó thật ra khá phức tạp và thú vị đó, 35 00:01:34,720 --> 00:01:36,880 nhưng ý tưởng là mình có một 36 00:01:36,880 --> 00:01:40,670 phân phối t khác, phụ thuộc vào cỡ mẫu, 37 00:01:40,670 --> 00:01:42,540 vào bậc tự do, 38 00:01:42,540 --> 00:01:44,990 và bậc tự do của mình sẽ bằng 39 00:01:44,990 --> 00:01:47,490 cỡ mẫu của mình trừ 1. 40 00:01:47,490 --> 00:01:50,060 Trong trường hợp này, bậc tự do của mình 41 00:01:50,060 --> 00:01:54,100 bằng 15 trừ 1, vậy trong trường hợp này, bậc tự do của mình 42 00:01:54,100 --> 00:01:56,160 sẽ bằng 14. 43 00:01:56,160 --> 00:01:58,450 Đây không phải lần đầu mình nói về 44 00:01:58,450 --> 00:02:00,530 bậc tự do, mình đã nói đôi chút 45 00:02:00,530 --> 00:02:03,470 về nó khi bàn về độ lệch chuẩn của mẫu và cách 46 00:02:03,470 --> 00:02:05,210 để có một ước lượng không thiên vị 47 00:02:05,210 --> 00:02:07,390 cho độ lệch chuẩn tổng thể. 48 00:02:07,390 --> 00:02:09,840 Trong các videos sau, mình sẽ nói kỹ hơn 49 00:02:09,840 --> 00:02:12,080 về bậc tự do, nhưng với bài này thôi 50 00:02:12,080 --> 00:02:14,640 thì mình chỉ cần biết là 51 00:02:14,640 --> 00:02:17,380 khi mình nhìn vào phân phối t 52 00:02:17,380 --> 00:02:19,640 cho một bậc tự do bất kì, bậc tự do đó 53 00:02:19,640 --> 00:02:21,490 phụ thuộc vào cỡ mẫu, và 54 00:02:21,490 --> 00:02:23,760 sẽ bằng cỡ mẫu trừ 1 khi mình nghĩ về 55 00:02:23,760 --> 00:02:26,280 khoảng tin cậy cho trung bình. 56 00:02:26,280 --> 00:02:29,080 Giờ hãy nhìn vào bảng t của mình. 57 00:02:29,080 --> 00:02:32,005 Mình muốn có khoảng tin cậy 98% 58 00:02:32,005 --> 00:02:36,890 và có bậc tự do 14. 59 00:02:36,890 --> 00:02:40,010 Vậy hãy lấy bảng t ra, và thật ra mình đã 60 00:02:40,010 --> 00:02:41,940 đưa phần dưới lên trên 61 00:02:41,940 --> 00:02:43,650 để bạn dễ theo dõi. 62 00:02:43,650 --> 00:02:45,300 Bảng t này tốt ở chỗ 63 00:02:45,300 --> 00:02:47,300 nó đã cho mình mức độ tin cậy 64 00:02:47,300 --> 00:02:50,450 ngay đây, nên nếu mình muốn mức độ tin cậy 98% 65 00:02:50,450 --> 00:02:53,020 mình chỉ cần nhìn vào cột này, 66 00:02:53,020 --> 00:02:55,580 cột này ngay đây. 67 00:02:55,580 --> 00:02:59,160 Cách khác để nghĩ về mức độ tin cậy 98%, 68 00:02:59,160 --> 00:03:02,620 nếu mình có mức độ tin cậy 98%, 69 00:03:02,620 --> 00:03:07,230 thì mình sẽ còn thiếu 1% ở mỗi đuôi, 70 00:03:07,230 --> 00:03:09,680 vậy nếu mình nhìn vào 71 00:03:09,680 --> 00:03:12,780 phân phối t của mình, mọi thứ lên đến và bao gồm 72 00:03:12,780 --> 00:03:16,620 1% đầu, mình sẽ chú ý xác suất đuôi 73 00:03:16,620 --> 00:03:21,450 0,01, và nó sẽ-- hơi khó thấy nhỉ, 74 00:03:21,450 --> 00:03:23,040 để mình dùng màu sáng hơn, 75 00:03:23,040 --> 00:03:25,820 nó sẽ là xác suất đuôi phải. 76 00:03:25,820 --> 00:03:27,650 Vậy mình ở cột ngay đây. 77 00:03:27,650 --> 00:03:30,080 Mình có khoảng tin cậy 98%. 78 00:03:30,080 --> 00:03:32,330 Nhớ là bậc tự do của mình, 79 00:03:32,330 --> 00:03:37,193 bậc tự do của mình ngay đây, mình có 14 bậc tự do, 80 00:03:37,193 --> 00:03:41,613 vậy mình sẽ quan tâm hàng này. 81 00:03:41,613 --> 00:03:43,210 Vậy ra rồi. 82 00:03:43,210 --> 00:03:48,750 Mình có giá trị tới hạn t 2,624. 83 00:03:48,750 --> 00:03:51,200 Vậy quay lại với bài, 84 00:03:51,200 --> 00:03:57,400 2,624 là câu D. Mình tô nhầm á, nhưng câu D mới đúng nha.