WEBVTT 00:00:00.180 --> 00:00:01.940 trong video trước, ta bắt đầu suy nghĩ về 00:00:01.940 --> 00:00:04.720 các mà ta dùng đường hồi quy, cụ thể là 00:00:04.720 --> 00:00:08.090 hệ số góc dựa trên dữ liệu mẫu 00:00:08.090 --> 00:00:10.910 ta có thể dùng nó để suy luận 00:00:10.910 --> 00:00:15.700 về hệ số góc của đường hồi quy tổng thể 00:00:15.700 --> 00:00:17.960 trong video này, ta sẽ nghĩ về 00:00:17.960 --> 00:00:20.260 điều kiện gì để suy ra 00:00:20.260 --> 00:00:22.610 khi ta đang tính với đường hồi quy? 00:00:22.610 --> 00:00:24.900 và chúng sẽ tương tự 00:00:24.900 --> 00:00:27.280 với điều kiện cho suy luận 00:00:27.280 --> 00:00:30.320 mà ta nghĩ về khi đang kiểm tra giả thuyết 00:00:30.320 --> 00:00:33.920 và khoảng tin cậy cho trung bình và tỉ lệ, 00:00:33.920 --> 00:00:36.890 nhưng cũng sẽ có vài điều kiện mới 00:00:36.890 --> 00:00:39.860 để nhớ các điều kiện này, 00:00:39.860 --> 00:00:44.860 bạn hãy nghĩ về từ viết tắt LINER 00:00:46.950 --> 00:00:50.500 nếu bạn không thấy rõ, nó gần giống tuyến tính 00:00:50.500 --> 00:00:53.040 Liner, nếu có chữ a, nó sẽ là tuyến tính 00:00:53.040 --> 00:00:54.670 cái này quan trọng bởi vì, nhớ là, 00:00:54.670 --> 00:00:57.140 ta đang nghĩ về hồi quy tuyến tính 00:00:57.140 --> 00:01:01.240 Chữ L ở đây nghĩa là tuyến tính 00:01:01.240 --> 00:01:05.000 ở đây, điều kiện, là mối quan hệ 00:01:05.000 --> 00:01:08.620 trong tổng thể giữa các biến x và y 00:01:08.620 --> 00:01:11.290 là mối quan hệ tuyến tính 00:01:11.290 --> 00:01:12.710 vậy là mối 00:01:13.690 --> 00:01:14.750 quan hệ 00:01:15.670 --> 00:01:16.853 tuyến tính, 00:01:18.360 --> 00:01:19.310 tuyến tính 00:01:20.230 --> 00:01:21.690 giữa 00:01:21.690 --> 00:01:23.950 giữa x 00:01:23.950 --> 00:01:25.910 và y. 00:01:25.910 --> 00:01:28.920 trong rất nhiều trường hợp, bạn có thể giả sử 00:01:28.920 --> 00:01:31.270 đây là trường hợp bạn nhìn thấy 00:01:31.270 --> 00:01:33.950 trong bài thi, ví dụ như bài AP 00:01:33.950 --> 00:01:36.400 đề cho, giả sử điều kiện này thoả 00:01:36.400 --> 00:01:37.720 thường thì, nó sẽ giả sử 00:01:37.720 --> 00:01:38.600 tất cả điều kiện đều thoả 00:01:38.600 --> 00:01:41.100 đề chỉ muốn bạn biết về mấy điều kiện này. 00:01:41.100 --> 00:01:42.810 nhưng đây là điều ta nên nghĩ 00:01:42.810 --> 00:01:45.660 nếu mối quan hệ đó không quyến tính, 00:01:45.660 --> 00:01:47.250 thì có thể một vài 00:01:47.250 --> 00:01:50.150 suy luận của bạn không chắc chắn 00:01:50.150 --> 00:01:53.290 cái tiếp theo là cái ta đã thấy rồi 00:01:53.290 --> 00:01:55.560 khi nói về điều kiện chung để suy luận 00:01:55.560 --> 00:01:57.530 và đây là điều kiện 00:01:57.530 --> 00:01:59.960 độc lập 00:01:59.960 --> 00:02:01.980 có vài cách để nghĩ 00:02:01.980 --> 00:02:04.070 hai sự quan sát đều 00:02:04.070 --> 00:02:05.830 độc lập với nhau 00:02:05.830 --> 00:02:09.180 nên bạn có thể lấy mẫu và thay thế 00:02:09.180 --> 00:02:11.910 hoặc bạn có thể nghĩ về quy tắc 10% 00:02:11.910 --> 00:02:13.430 mà ta đã làm khi nghĩ về 00:02:13.430 --> 00:02:18.200 điều kiện độc lập cho tỉ lệ và trung bình, 00:02:18.200 --> 00:02:20.010 mà ta cần phải chắc chắn 00:02:20.010 --> 00:02:23.710 là kích thước của mẫu không lớn hơn 10% 00:02:23.710 --> 00:02:26.070 kích thước của tổng thể 00:02:26.070 --> 00:02:28.140 tiếp theo là điều kiện tiêu chuẩn, 00:02:28.140 --> 00:02:30.230 mà ta đã nói về khi suy luận 00:02:30.230 --> 00:02:32.610 với tỉ lệ và trung bình 00:02:32.610 --> 00:02:35.170 mặc dù nó nghĩa là một cái gì đó ít phức tạp hơn 00:02:35.170 --> 00:02:37.580 khi ta tính với hồi quy 00:02:37.580 --> 00:02:39.590 điều kiện tiêu chuẩn, 00:02:39.590 --> 00:02:42.160 nhiều khi người ta cứ giả sử nó được thoả rồi 00:02:42.160 --> 00:02:43.820 nhưng để mình vẽ đường hồi quy, 00:02:43.820 --> 00:02:44.880 thêm các chiều 00:02:44.880 --> 00:02:46.670 rồi chiều thứ 3 00:02:46.670 --> 00:02:48.410 đó là trục x, 00:02:48.410 --> 00:02:50.500 đây là trục y. 00:02:50.500 --> 00:02:54.810 và tổng thể hồi quy thực sẽ nhìn như vầy 00:02:54.810 --> 00:02:57.270 vậy điều kiện tiêu chuẩn cho ta biết 00:02:57.270 --> 00:03:00.033 với bất kì x nào trong tổng thể, 00:03:00.870 --> 00:03:05.770 sự phân phối của các y sẽ là tiêu chuẩn, 00:03:05.770 --> 00:03:06.603 là tiêu chuẩn 00:03:06.603 --> 00:03:08.810 để mình vẽ phân phối tiêu chuẩn 00:03:08.810 --> 00:03:10.910 cho các y 00:03:10.910 --> 00:03:11.870 với giá trị x đó 00:03:11.870 --> 00:03:13.990 vậy đó sẽ là phân phối tiêu chuẩn 00:03:13.990 --> 00:03:16.860 cho là, với x này ở đây, 00:03:16.860 --> 00:03:21.300 bạn sẽ muốn có phân phối tiêu chuẩn 00:03:21.300 --> 00:03:23.460 giống như 00:03:23.460 --> 00:03:24.530 vậy 00:03:24.530 --> 00:03:25.380 nếu ta có x, 00:03:25.380 --> 00:03:27.760 phân phối của các y sẽ là tiêu chuẩn 00:03:27.760 --> 00:03:29.750 một lần nữa, bất kì khi nào đề yêu cầu 00:03:29.750 --> 00:03:32.470 giả sử cái này thoả vì nó có thể 00:03:32.470 --> 00:03:34.390 ít nhất là trong lớp thống kê cơ bản, 00:03:34.390 --> 00:03:36.970 hơi khó để cho bạn tự tính 00:03:36.970 --> 00:03:38.810 điều kiện tiếp theo sẽ liên quan tới nó, 00:03:38.810 --> 00:03:42.790 đây là khái niệm có phương sai bằng nhau, 00:03:42.790 --> 00:03:45.090 phương sai bằng nhau 00:03:45.090 --> 00:03:46.390 và nó nghĩa là mỗi 00:03:46.390 --> 00:03:48.670 phân phối chuẩn này nên có 00:03:48.670 --> 00:03:51.250 độ phân phối giống nhau với cùng x 00:03:51.250 --> 00:03:52.870 hoặc bạn có thể nói phương sai bằng nhau 00:03:52.870 --> 00:03:54.520 hoặc bạn có thể nghĩ là chúng có 00:03:54.520 --> 00:03:56.360 cùng độ lệch tiêu chuẩn 00:03:56.360 --> 00:03:59.880 ví dụ, nếu, cho giá trị x, cho là giá trị x này, 00:03:59.880 --> 00:04:02.580 đột nhiên, bạn có phương sai thấp hơn, 00:04:02.580 --> 00:04:03.620 nó sẽ nhìn như vầy, 00:04:03.620 --> 00:04:06.890 khi đó bạn sẽ không thoả điều kiện để suy luận 00:04:06.890 --> 00:04:10.430 cuối cùng, cái này ta đã thấy nhiều lần, 00:04:10.430 --> 00:04:12.300 là điều kiện ngẫu nhiên 00:04:12.300 --> 00:04:14.600 đây là dữ liệu từ 00:04:14.600 --> 00:04:17.170 một mẫu ngẫu nhiên được thiết kế tốt 00:04:17.170 --> 00:04:19.200 hoặc một thí nghiệm ngẫu nhiên 00:04:19.200 --> 00:04:23.040 và điều kiện này ta đã thấy trong mọi loại điều kiện 00:04:23.040 --> 00:04:25.760 để suy ra mà ta đã xem xét 00:04:25.760 --> 00:04:27.140 mình sẽ để bạn suy nghĩ 00:04:27.140 --> 00:04:28.270 tốt để biết 00:04:28.270 --> 00:04:30.470 nó sẽ xuất hiện trong vài kì thi 00:04:30.470 --> 00:04:32.960 nhưng nhiều lần, khi giải quyết bài toán, 00:04:32.960 --> 00:04:36.130 trong lớp thống kê cơ bản, đề sẽ yêu cầu bạn 00:04:36.130 --> 00:04:38.720 giả sử điều kiện suy ra đã được thoả 00:04:38.720 --> 00:04:40.910 hoặc điều kiện để suy luận là gì? 00:04:40.910 --> 00:04:42.970 nhưng sẽ không yêu cầu bạn phải chứng minh, 00:04:42.970 --> 00:04:46.010 ví dụ, điều kiện tiêu chuẩn hoặc phương sai bằng nhau 00:04:46.010 --> 00:04:47.040 cái đó hơi khó đối với 00:04:47.040 --> 00:04:49.763 lớp thống kê cơ bản