WEBVTT 00:00:00.180 --> 00:00:01.940 이전 강의에서 00:00:01.940 --> 00:00:04.720 회귀선을 어떻게 사용하는지 00:00:04.720 --> 00:00:08.090 특히, 모집단에서 회귀선의 기울기에 관하여 00:00:08.090 --> 00:00:10.910 추론을 하기 위해 어떻게 표본자료를 바탕으로 00:00:10.910 --> 00:00:15.700 회귀선의 기울기를 사용하는지 생각해 보았습니다 00:00:15.700 --> 00:00:17.960 이번 시간에는 00:00:17.960 --> 00:00:20.260 회귀선을 다룰 때 00:00:20.260 --> 00:00:22.610 추론을 위한 조건이 무엇인지 알아보고자 합니다 00:00:22.610 --> 00:00:24.900 어떻게 보면 00:00:24.900 --> 00:00:27.280 평균, 혹은 비율에 대한 신뢰구간이나 00:00:27.280 --> 00:00:30.320 가설검정을 시행할 때 고려했던 00:00:30.320 --> 00:00:33.920 추론을 위한 조건과 유사한 부분이 있습니다 00:00:33.920 --> 00:00:36.890 하지만 새로운 조건도 있습니다 00:00:36.890 --> 00:00:39.860 이 조건들을 기억하기 위해 00:00:39.860 --> 00:00:46.940 줄임말 LINER를 기억하세요 00:00:46.940 --> 00:00:50.480 와닿지 않는다면 선형(linear)과 유사합니다 00:00:50.500 --> 00:00:53.040 여기에 a가 있으면 선형(linear)이 되겠죠 00:00:53.040 --> 00:00:54.670 이는 기억할 가치가 있습니다 00:00:54.670 --> 00:00:57.140 회귀선에 대해 알아보고 있죠 00:00:57.140 --> 00:01:01.240 L은 선형(linear)을 나타냅니다 00:01:01.240 --> 00:01:05.000 여기서 조건은 모집단에서 00:01:05.000 --> 00:01:08.620 변수 x와 y 사이의 실제 관계가 00:01:08.620 --> 00:01:11.290 선형 관계라는 것입니다 00:01:11.290 --> 00:01:13.700 선형 관계 00:01:13.700 --> 00:01:15.680 선형 관계 00:01:15.680 --> 00:01:18.340 선형 관계 00:01:18.340 --> 00:01:20.180 선형 관계 00:01:20.180 --> 00:01:21.660 x와 y 사이에서 00:01:21.690 --> 00:01:23.950 x와 y 사이에서 00:01:23.950 --> 00:01:25.910 x와 y 사이에서 00:01:25.910 --> 00:01:28.920 대부분의 경우 00:01:28.920 --> 00:01:31.270 예를 들어, AP 시험에서 00:01:31.270 --> 00:01:33.950 이와 같은 조건은 00:01:33.950 --> 00:01:36.400 만족한다고 가정합니다 00:01:36.400 --> 00:01:37.720 일반적으로 00:01:37.720 --> 00:01:38.600 모든 조건은 만족한다고 가정합니다 00:01:38.600 --> 00:01:41.100 이 조건들이 무엇인지 아는 게 더 중요합니다 00:01:41.100 --> 00:01:42.810 하지만 생각해 보세요 00:01:42.810 --> 00:01:45.660 이 관계가 선형이 아니라면 00:01:45.660 --> 00:01:47.250 추론이 탄탄하지 않겠죠 00:01:47.250 --> 00:01:50.150 추론이 탄탄하지 않겠죠 00:01:50.150 --> 00:01:53.290 다음 조건은 00:01:53.290 --> 00:01:55.560 보통 추론을 위한 조건으로 언급되는 00:01:55.560 --> 00:01:57.530 독립성(independence) 조건입니다 00:01:57.530 --> 00:01:59.960 독립성(independence) 조건입니다 00:01:59.960 --> 00:02:01.980 여러 가지 방식으로 생각해보죠 00:02:01.980 --> 00:02:04.070 각 개체가 00:02:04.070 --> 00:02:05.830 서로 독립이려면 00:02:05.830 --> 00:02:09.180 복원추출하면 됩니다 00:02:09.180 --> 00:02:11.910 아니면 10% 조건도 있습니다 00:02:11.910 --> 00:02:13.430 비율, 혹은 평균에 대한 00:02:13.430 --> 00:02:18.200 독립성 조건을 고려할 때 했던 내용이죠 00:02:18.200 --> 00:02:20.010 표본의 크기가 00:02:20.010 --> 00:02:23.710 모집단의 10%를 넘지 않아야 00:02:23.710 --> 00:02:26.070 성립합니다 00:02:26.070 --> 00:02:28.140 다음은 일반성(normal) 조건입니다 00:02:28.140 --> 00:02:30.230 비율, 평균에 대한 추론을 할 때 00:02:30.230 --> 00:02:32.610 했던 부분이죠 00:02:32.610 --> 00:02:35.170 그러나, 회귀선을 다룰 때에는 00:02:35.170 --> 00:02:37.580 조금 더 복잡합니다 00:02:37.580 --> 00:02:39.590 일반성 조건은 보통 00:02:39.590 --> 00:02:42.160 만족한다고 가정했죠 00:02:42.160 --> 00:02:43.820 하지만 회귀선을 그려보면 00:02:43.820 --> 00:02:44.880 원근법을 사용합니다 00:02:44.880 --> 00:02:46.670 3차원 공간입니다 00:02:46.670 --> 00:02:48.410 이것은 x축 00:02:48.410 --> 00:02:50.500 이것은 y축입니다 00:02:50.500 --> 00:02:54.810 모집단에서 회귀선은 이런 모습입니다 00:02:54.810 --> 00:02:57.270 따라서 일반성 조건은 00:02:57.270 --> 00:03:00.800 모집단에서 주어진 어떠한 x에 대해서도 00:03:00.800 --> 00:03:04.640 예상하는 y의 분포는 00:03:04.640 --> 00:03:06.580 정규분포를 따릅니다 00:03:06.603 --> 00:03:08.810 x가 주어졌을 때 00:03:08.810 --> 00:03:10.910 y에 대한 정규분포를 00:03:10.910 --> 00:03:11.870 그릴 수 있는지 확인해 봅시다 00:03:11.870 --> 00:03:13.990 여기 정규분포가 있습니다 00:03:13.990 --> 00:03:16.860 이 x에 대해서 00:03:16.860 --> 00:03:21.300 정규분포를 예상할 수 있습니다 00:03:21.300 --> 00:03:23.460 이렇게 말이죠 00:03:23.460 --> 00:03:24.530 이렇게 말이죠 00:03:24.530 --> 00:03:25.380 x가 주어진다면 00:03:25.380 --> 00:03:27.760 y의 분포는 정규분포를 따릅니다 00:03:27.760 --> 00:03:29.750 보통 이 조건은 00:03:29.750 --> 00:03:32.470 만족한다 하고 넘어갈 것입니다 00:03:32.470 --> 00:03:34.390 적어도 통계학 입문에서는 00:03:34.390 --> 00:03:36.970 여러분이 다루기에 조금 어렵기 때문이죠 00:03:36.970 --> 00:03:38.810 다음 조건입니다 00:03:38.810 --> 00:03:42.790 동일한(equal) 분산 조건입니다 00:03:42.790 --> 00:03:45.090 동일한(equal) 분산 조건입니다 00:03:45.090 --> 00:03:46.390 이는 주어진 x에 대하여 00:03:46.390 --> 00:03:48.670 이 정규분포들이 00:03:48.670 --> 00:03:51.250 산포도가 같아야 한다는 것이죠 00:03:51.250 --> 00:03:52.870 따라서 분산이 같다고 할 수 있고 00:03:52.870 --> 00:03:54.520 아니면 표준편차가 같다고 할 수 있습니다 00:03:54.520 --> 00:03:56.360 아니면 표준편차가 같다고 할 수 있습니다 00:03:56.360 --> 00:03:59.880 예를 들어 여기 주어진 x가 00:03:59.880 --> 00:04:02.580 이런 모습을 나타내며 00:04:02.580 --> 00:04:03.620 분산이 작다면 00:04:03.620 --> 00:04:06.890 추론을 위한 조건을 만족하지 않게 되겠죠 00:04:06.890 --> 00:04:10.430 마지막으로 우리에게 익숙한 조건입니다 00:04:10.430 --> 00:04:12.300 임의성(random) 조건입니다 00:04:12.300 --> 00:04:14.600 이 조건은 자료들이 00:04:14.600 --> 00:04:17.170 잘 설계된 임의표본이나 00:04:17.170 --> 00:04:19.200 한 무작위 실험으로부터 나왔다는 것입니다 00:04:19.200 --> 00:04:23.040 또한 이 조건은 지금까지 추론을 위한 조건으로 00:04:23.040 --> 00:04:25.760 모든 경우에서 쓰였습니다 00:04:25.760 --> 00:04:27.140 그냥 넘어갈게요 00:04:27.140 --> 00:04:28.270 LINER 알아두세요 00:04:28.270 --> 00:04:30.470 시험에 잘 나옵니다 00:04:30.470 --> 00:04:32.960 하지만 대부분의 경우 문제를 풀 때 00:04:32.960 --> 00:04:36.130 통계학 입문에서는 00:04:36.130 --> 00:04:38.720 추론을 위한 조건이 만족되었다고 가정할 것입니다 00:04:38.720 --> 00:04:40.910 아니면 추론을 위한 조건에 무엇이 있는지 물어볼 것입니다 00:04:40.910 --> 00:04:42.970 그러나 증명하라고는 안할 것입니다 00:04:42.970 --> 00:04:46.010 예를 들어, 일반성 조건이나 동일한 분산조건은 00:04:46.010 --> 00:04:47.040 통계학 입문에서 다루기엔 00:04:47.040 --> 00:04:49.763 조금 과합니다