0:00:00.180,0:00:01.940 이전 강의에서 0:00:01.940,0:00:04.720 회귀선을 어떻게 사용하는지 0:00:04.720,0:00:08.090 특히, 모집단에서[br]회귀선의 기울기에 관하여 0:00:08.090,0:00:10.910 추론을 하기 위해[br]어떻게 표본자료를 바탕으로 0:00:10.910,0:00:15.700 회귀선의 기울기를 사용하는지[br]생각해 보았습니다 0:00:15.700,0:00:17.960 이번 시간에는 0:00:17.960,0:00:20.260 회귀선을 다룰 때 0:00:20.260,0:00:22.610 추론을 위한 조건이[br]무엇인지 알아보고자 합니다 0:00:22.610,0:00:24.900 어떻게 보면 0:00:24.900,0:00:27.280 평균, 혹은 비율에 대한[br]신뢰구간이나 0:00:27.280,0:00:30.320 가설검정을 시행할 때 고려했던 0:00:30.320,0:00:33.920 추론을 위한 조건과[br]유사한 부분이 있습니다 0:00:33.920,0:00:36.890 하지만 새로운[br]조건도 있습니다 0:00:36.890,0:00:39.860 이 조건들을 기억하기 위해 0:00:39.860,0:00:46.940 줄임말 LINER를 기억하세요 0:00:46.940,0:00:50.480 와닿지 않는다면[br]선형(linear)과 유사합니다 0:00:50.500,0:00:53.040 여기에 a가 있으면[br]선형(linear)이 되겠죠 0:00:53.040,0:00:54.670 이는 기억할 가치가 있습니다 0:00:54.670,0:00:57.140 회귀선에 대해 알아보고 있죠 0:00:57.140,0:01:01.240 L은 선형(linear)을 나타냅니다 0:01:01.240,0:01:05.000 여기서 조건은 모집단에서 0:01:05.000,0:01:08.620 변수 x와 y 사이의[br]실제 관계가 0:01:08.620,0:01:11.290 선형 관계라는 것입니다 0:01:11.290,0:01:13.700 선형 관계 0:01:13.700,0:01:15.680 선형 관계 0:01:15.680,0:01:18.340 선형 관계 0:01:18.340,0:01:20.180 선형 관계 0:01:20.180,0:01:21.660 x와 y 사이에서 0:01:21.690,0:01:23.950 x와 y 사이에서 0:01:23.950,0:01:25.910 x와 y 사이에서 0:01:25.910,0:01:28.920 대부분의 경우 0:01:28.920,0:01:31.270 예를 들어, AP 시험에서 0:01:31.270,0:01:33.950 이와 같은 조건은 0:01:33.950,0:01:36.400 만족한다고 가정합니다 0:01:36.400,0:01:37.720 일반적으로 0:01:37.720,0:01:38.600 모든 조건은[br]만족한다고 가정합니다 0:01:38.600,0:01:41.100 이 조건들이 무엇인지[br]아는 게 더 중요합니다 0:01:41.100,0:01:42.810 하지만 생각해 보세요 0:01:42.810,0:01:45.660 이 관계가 선형이 아니라면 0:01:45.660,0:01:47.250 추론이 탄탄하지 않겠죠 0:01:47.250,0:01:50.150 추론이 탄탄하지 않겠죠 0:01:50.150,0:01:53.290 다음 조건은 0:01:53.290,0:01:55.560 보통 추론을 위한[br]조건으로 언급되는 0:01:55.560,0:01:57.530 독립성(independence)[br]조건입니다 0:01:57.530,0:01:59.960 독립성(independence)[br]조건입니다 0:01:59.960,0:02:01.980 여러 가지 방식으로[br]생각해보죠 0:02:01.980,0:02:04.070 각 개체가 0:02:04.070,0:02:05.830 서로 독립이려면 0:02:05.830,0:02:09.180 복원추출하면 됩니다 0:02:09.180,0:02:11.910 아니면 10% 조건도 있습니다 0:02:11.910,0:02:13.430 비율, 혹은 평균에 대한 0:02:13.430,0:02:18.200 독립성 조건을 고려할 때[br]했던 내용이죠 0:02:18.200,0:02:20.010 표본의 크기가 0:02:20.010,0:02:23.710 모집단의 10%를 넘지 않아야 0:02:23.710,0:02:26.070 성립합니다 0:02:26.070,0:02:28.140 다음은[br]일반성(normal) 조건입니다 0:02:28.140,0:02:30.230 비율, 평균에 대한 추론을 할 때 0:02:30.230,0:02:32.610 했던 부분이죠 0:02:32.610,0:02:35.170 그러나, 회귀선을 다룰 때에는 0:02:35.170,0:02:37.580 조금 더 복잡합니다 0:02:37.580,0:02:39.590 일반성 조건은 보통 0:02:39.590,0:02:42.160 만족한다고 가정했죠 0:02:42.160,0:02:43.820 하지만 회귀선을 그려보면 0:02:43.820,0:02:44.880 원근법을 사용합니다 0:02:44.880,0:02:46.670 3차원 공간입니다 0:02:46.670,0:02:48.410 이것은 x축 0:02:48.410,0:02:50.500 이것은 y축입니다 0:02:50.500,0:02:54.810 모집단에서 회귀선은[br]이런 모습입니다 0:02:54.810,0:02:57.270 따라서 일반성 조건은 0:02:57.270,0:03:00.800 모집단에서 주어진[br]어떠한 x에 대해서도 0:03:00.800,0:03:04.640 예상하는 y의 분포는 0:03:04.640,0:03:06.580 정규분포를 따릅니다 0:03:06.603,0:03:08.810 x가 주어졌을 때 0:03:08.810,0:03:10.910 y에 대한 정규분포를 0:03:10.910,0:03:11.870 그릴 수 있는지[br]확인해 봅시다 0:03:11.870,0:03:13.990 여기 정규분포가 있습니다 0:03:13.990,0:03:16.860 이 x에 대해서 0:03:16.860,0:03:21.300 정규분포를 예상할 수 있습니다 0:03:21.300,0:03:23.460 이렇게 말이죠 0:03:23.460,0:03:24.530 이렇게 말이죠 0:03:24.530,0:03:25.380 x가 주어진다면 0:03:25.380,0:03:27.760 y의 분포는 정규분포를 따릅니다 0:03:27.760,0:03:29.750 보통 이 조건은 0:03:29.750,0:03:32.470 만족한다 하고 넘어갈 것입니다 0:03:32.470,0:03:34.390 적어도 통계학 입문에서는 0:03:34.390,0:03:36.970 여러분이 다루기에[br]조금 어렵기 때문이죠 0:03:36.970,0:03:38.810 다음 조건입니다 0:03:38.810,0:03:42.790 동일한(equal) 분산 조건입니다 0:03:42.790,0:03:45.090 동일한(equal) 분산 조건입니다 0:03:45.090,0:03:46.390 이는 주어진 x에 대하여 0:03:46.390,0:03:48.670 이 정규분포들이 0:03:48.670,0:03:51.250 산포도가 같아야[br]한다는 것이죠 0:03:51.250,0:03:52.870 따라서 분산이[br]같다고 할 수 있고 0:03:52.870,0:03:54.520 아니면 표준편차가 같다고[br]할 수 있습니다 0:03:54.520,0:03:56.360 아니면 표준편차가 같다고[br]할 수 있습니다 0:03:56.360,0:03:59.880 예를 들어[br]여기 주어진 x가 0:03:59.880,0:04:02.580 이런 모습을 나타내며 0:04:02.580,0:04:03.620 분산이 작다면 0:04:03.620,0:04:06.890 추론을 위한 조건을[br]만족하지 않게 되겠죠 0:04:06.890,0:04:10.430 마지막으로[br]우리에게 익숙한 조건입니다 0:04:10.430,0:04:12.300 임의성(random) 조건입니다 0:04:12.300,0:04:14.600 이 조건은 자료들이 0:04:14.600,0:04:17.170 잘 설계된 임의표본이나 0:04:17.170,0:04:19.200 한 무작위 실험으로부터[br]나왔다는 것입니다 0:04:19.200,0:04:23.040 또한 이 조건은 지금까지[br]추론을 위한 조건으로 0:04:23.040,0:04:25.760 모든 경우에서 쓰였습니다 0:04:25.760,0:04:27.140 그냥 넘어갈게요 0:04:27.140,0:04:28.270 LINER[br]알아두세요 0:04:28.270,0:04:30.470 시험에 잘 나옵니다 0:04:30.470,0:04:32.960 하지만 대부분의 경우[br]문제를 풀 때 0:04:32.960,0:04:36.130 통계학 입문에서는 0:04:36.130,0:04:38.720 추론을 위한 조건이[br]만족되었다고 가정할 것입니다 0:04:38.720,0:04:40.910 아니면 추론을 위한 조건에[br]무엇이 있는지 물어볼 것입니다 0:04:40.910,0:04:42.970 그러나 증명하라고는[br]안할 것입니다 0:04:42.970,0:04:46.010 예를 들어, 일반성 조건이나[br]동일한 분산조건은 0:04:46.010,0:04:47.040 통계학 입문에서 다루기엔 0:04:47.040,0:04:49.763 조금 과합니다