1 00:00:00,180 --> 00:00:01,940 이전 강의에서 2 00:00:01,940 --> 00:00:04,720 회귀선을 어떻게 사용하는지 3 00:00:04,720 --> 00:00:08,090 특히, 모집단에서 회귀선의 기울기에 관하여 4 00:00:08,090 --> 00:00:10,910 추론을 하기 위해 어떻게 표본자료를 바탕으로 5 00:00:10,910 --> 00:00:15,700 회귀선의 기울기를 사용하는지 생각해 보았습니다 6 00:00:15,700 --> 00:00:17,960 이번 시간에는 7 00:00:17,960 --> 00:00:20,260 회귀선을 다룰 때 8 00:00:20,260 --> 00:00:22,610 추론을 위한 조건이 무엇인지 알아보고자 합니다 9 00:00:22,610 --> 00:00:24,900 어떻게 보면 10 00:00:24,900 --> 00:00:27,280 평균, 혹은 비율에 대한 신뢰구간이나 11 00:00:27,280 --> 00:00:30,320 가설검정을 시행할 때 고려했던 12 00:00:30,320 --> 00:00:33,920 추론을 위한 조건과 유사한 부분이 있습니다 13 00:00:33,920 --> 00:00:36,890 하지만 새로운 조건도 있습니다 14 00:00:36,890 --> 00:00:39,860 이 조건들을 기억하기 위해 15 00:00:39,860 --> 00:00:46,940 줄임말 LINER를 기억하세요 16 00:00:46,940 --> 00:00:50,480 와닿지 않는다면 선형(linear)과 유사합니다 17 00:00:50,500 --> 00:00:53,040 여기에 a가 있으면 선형(linear)이 되겠죠 18 00:00:53,040 --> 00:00:54,670 이는 기억할 가치가 있습니다 19 00:00:54,670 --> 00:00:57,140 회귀선에 대해 알아보고 있죠 20 00:00:57,140 --> 00:01:01,240 L은 선형(linear)을 나타냅니다 21 00:01:01,240 --> 00:01:05,000 여기서 조건은 모집단에서 22 00:01:05,000 --> 00:01:08,620 변수 x와 y 사이의 실제 관계가 23 00:01:08,620 --> 00:01:11,290 선형 관계라는 것입니다 24 00:01:11,290 --> 00:01:13,700 선형 관계 25 00:01:13,700 --> 00:01:15,680 선형 관계 26 00:01:15,680 --> 00:01:18,340 선형 관계 27 00:01:18,340 --> 00:01:20,180 선형 관계 28 00:01:20,180 --> 00:01:21,660 x와 y 사이에서 29 00:01:21,690 --> 00:01:23,950 x와 y 사이에서 30 00:01:23,950 --> 00:01:25,910 x와 y 사이에서 31 00:01:25,910 --> 00:01:28,920 대부분의 경우 32 00:01:28,920 --> 00:01:31,270 예를 들어, AP 시험에서 33 00:01:31,270 --> 00:01:33,950 이와 같은 조건은 34 00:01:33,950 --> 00:01:36,400 만족한다고 가정합니다 35 00:01:36,400 --> 00:01:37,720 일반적으로 36 00:01:37,720 --> 00:01:38,600 모든 조건은 만족한다고 가정합니다 37 00:01:38,600 --> 00:01:41,100 이 조건들이 무엇인지 아는 게 더 중요합니다 38 00:01:41,100 --> 00:01:42,810 하지만 생각해 보세요 39 00:01:42,810 --> 00:01:45,660 이 관계가 선형이 아니라면 40 00:01:45,660 --> 00:01:47,250 추론이 탄탄하지 않겠죠 41 00:01:47,250 --> 00:01:50,150 추론이 탄탄하지 않겠죠 42 00:01:50,150 --> 00:01:53,290 다음 조건은 43 00:01:53,290 --> 00:01:55,560 보통 추론을 위한 조건으로 언급되는 44 00:01:55,560 --> 00:01:57,530 독립성(independence) 조건입니다 45 00:01:57,530 --> 00:01:59,960 독립성(independence) 조건입니다 46 00:01:59,960 --> 00:02:01,980 여러 가지 방식으로 생각해보죠 47 00:02:01,980 --> 00:02:04,070 각 개체가 48 00:02:04,070 --> 00:02:05,830 서로 독립이려면 49 00:02:05,830 --> 00:02:09,180 복원추출하면 됩니다 50 00:02:09,180 --> 00:02:11,910 아니면 10% 조건도 있습니다 51 00:02:11,910 --> 00:02:13,430 비율, 혹은 평균에 대한 52 00:02:13,430 --> 00:02:18,200 독립성 조건을 고려할 때 했던 내용이죠 53 00:02:18,200 --> 00:02:20,010 표본의 크기가 54 00:02:20,010 --> 00:02:23,710 모집단의 10%를 넘지 않아야 55 00:02:23,710 --> 00:02:26,070 성립합니다 56 00:02:26,070 --> 00:02:28,140 다음은 일반성(normal) 조건입니다 57 00:02:28,140 --> 00:02:30,230 비율, 평균에 대한 추론을 할 때 58 00:02:30,230 --> 00:02:32,610 했던 부분이죠 59 00:02:32,610 --> 00:02:35,170 그러나, 회귀선을 다룰 때에는 60 00:02:35,170 --> 00:02:37,580 조금 더 복잡합니다 61 00:02:37,580 --> 00:02:39,590 일반성 조건은 보통 62 00:02:39,590 --> 00:02:42,160 만족한다고 가정했죠 63 00:02:42,160 --> 00:02:43,820 하지만 회귀선을 그려보면 64 00:02:43,820 --> 00:02:44,880 원근법을 사용합니다 65 00:02:44,880 --> 00:02:46,670 3차원 공간입니다 66 00:02:46,670 --> 00:02:48,410 이것은 x축 67 00:02:48,410 --> 00:02:50,500 이것은 y축입니다 68 00:02:50,500 --> 00:02:54,810 모집단에서 회귀선은 이런 모습입니다 69 00:02:54,810 --> 00:02:57,270 따라서 일반성 조건은 70 00:02:57,270 --> 00:03:00,800 모집단에서 주어진 어떠한 x에 대해서도 71 00:03:00,800 --> 00:03:04,640 예상하는 y의 분포는 72 00:03:04,640 --> 00:03:06,580 정규분포를 따릅니다 73 00:03:06,603 --> 00:03:08,810 x가 주어졌을 때 74 00:03:08,810 --> 00:03:10,910 y에 대한 정규분포를 75 00:03:10,910 --> 00:03:11,870 그릴 수 있는지 확인해 봅시다 76 00:03:11,870 --> 00:03:13,990 여기 정규분포가 있습니다 77 00:03:13,990 --> 00:03:16,860 이 x에 대해서 78 00:03:16,860 --> 00:03:21,300 정규분포를 예상할 수 있습니다 79 00:03:21,300 --> 00:03:23,460 이렇게 말이죠 80 00:03:23,460 --> 00:03:24,530 이렇게 말이죠 81 00:03:24,530 --> 00:03:25,380 x가 주어진다면 82 00:03:25,380 --> 00:03:27,760 y의 분포는 정규분포를 따릅니다 83 00:03:27,760 --> 00:03:29,750 보통 이 조건은 84 00:03:29,750 --> 00:03:32,470 만족한다 하고 넘어갈 것입니다 85 00:03:32,470 --> 00:03:34,390 적어도 통계학 입문에서는 86 00:03:34,390 --> 00:03:36,970 여러분이 다루기에 조금 어렵기 때문이죠 87 00:03:36,970 --> 00:03:38,810 다음 조건입니다 88 00:03:38,810 --> 00:03:42,790 동일한(equal) 분산 조건입니다 89 00:03:42,790 --> 00:03:45,090 동일한(equal) 분산 조건입니다 90 00:03:45,090 --> 00:03:46,390 이는 주어진 x에 대하여 91 00:03:46,390 --> 00:03:48,670 이 정규분포들이 92 00:03:48,670 --> 00:03:51,250 산포도가 같아야 한다는 것이죠 93 00:03:51,250 --> 00:03:52,870 따라서 분산이 같다고 할 수 있고 94 00:03:52,870 --> 00:03:54,520 아니면 표준편차가 같다고 할 수 있습니다 95 00:03:54,520 --> 00:03:56,360 아니면 표준편차가 같다고 할 수 있습니다 96 00:03:56,360 --> 00:03:59,880 예를 들어 여기 주어진 x가 97 00:03:59,880 --> 00:04:02,580 이런 모습을 나타내며 98 00:04:02,580 --> 00:04:03,620 분산이 작다면 99 00:04:03,620 --> 00:04:06,890 추론을 위한 조건을 만족하지 않게 되겠죠 100 00:04:06,890 --> 00:04:10,430 마지막으로 우리에게 익숙한 조건입니다 101 00:04:10,430 --> 00:04:12,300 임의성(random) 조건입니다 102 00:04:12,300 --> 00:04:14,600 이 조건은 자료들이 103 00:04:14,600 --> 00:04:17,170 잘 설계된 임의표본이나 104 00:04:17,170 --> 00:04:19,200 한 무작위 실험으로부터 나왔다는 것입니다 105 00:04:19,200 --> 00:04:23,040 또한 이 조건은 지금까지 추론을 위한 조건으로 106 00:04:23,040 --> 00:04:25,760 모든 경우에서 쓰였습니다 107 00:04:25,760 --> 00:04:27,140 그냥 넘어갈게요 108 00:04:27,140 --> 00:04:28,270 LINER 알아두세요 109 00:04:28,270 --> 00:04:30,470 시험에 잘 나옵니다 110 00:04:30,470 --> 00:04:32,960 하지만 대부분의 경우 문제를 풀 때 111 00:04:32,960 --> 00:04:36,130 통계학 입문에서는 112 00:04:36,130 --> 00:04:38,720 추론을 위한 조건이 만족되었다고 가정할 것입니다 113 00:04:38,720 --> 00:04:40,910 아니면 추론을 위한 조건에 무엇이 있는지 물어볼 것입니다 114 00:04:40,910 --> 00:04:42,970 그러나 증명하라고는 안할 것입니다 115 00:04:42,970 --> 00:04:46,010 예를 들어, 일반성 조건이나 동일한 분산조건은 116 00:04:46,010 --> 00:04:47,040 통계학 입문에서 다루기엔 117 00:04:47,040 --> 00:04:49,763 조금 과합니다