이전 강의에서 회귀선을 어떻게 사용하는지 특히, 모집단에서 회귀선의 기울기에 관하여 추론을 하기 위해 어떻게 표본자료를 바탕으로 회귀선의 기울기를 사용하는지 생각해 보았습니다 이번 시간에는 회귀선을 다룰 때 추론을 위한 조건이 무엇인지 알아보고자 합니다 어떻게 보면 평균, 혹은 비율에 대한 신뢰구간이나 가설검정을 시행할 때 고려했던 추론을 위한 조건과 유사한 부분이 있습니다 하지만 새로운 조건도 있습니다 이 조건들을 기억하기 위해 줄임말 LINER를 기억하세요 와닿지 않는다면 선형(linear)과 유사합니다 여기에 a가 있으면 선형(linear)이 되겠죠 이는 기억할 가치가 있습니다 회귀선에 대해 알아보고 있죠 L은 선형(linear)을 나타냅니다 여기서 조건은 모집단에서 변수 x와 y 사이의 실제 관계가 선형 관계라는 것입니다 선형 관계 선형 관계 선형 관계 선형 관계 x와 y 사이에서 x와 y 사이에서 x와 y 사이에서 대부분의 경우 예를 들어, AP 시험에서 이와 같은 조건은 만족한다고 가정합니다 일반적으로 모든 조건은 만족한다고 가정합니다 이 조건들이 무엇인지 아는 게 더 중요합니다 하지만 생각해 보세요 이 관계가 선형이 아니라면 추론이 탄탄하지 않겠죠 추론이 탄탄하지 않겠죠 다음 조건은 보통 추론을 위한 조건으로 언급되는 독립성(independence) 조건입니다 독립성(independence) 조건입니다 여러 가지 방식으로 생각해보죠 각 개체가 서로 독립이려면 복원추출하면 됩니다 아니면 10% 조건도 있습니다 비율, 혹은 평균에 대한 독립성 조건을 고려할 때 했던 내용이죠 표본의 크기가 모집단의 10%를 넘지 않아야 성립합니다 다음은 일반성(normal) 조건입니다 비율, 평균에 대한 추론을 할 때 했던 부분이죠 그러나, 회귀선을 다룰 때에는 조금 더 복잡합니다 일반성 조건은 보통 만족한다고 가정했죠 하지만 회귀선을 그려보면 원근법을 사용합니다 3차원 공간입니다 이것은 x축 이것은 y축입니다 모집단에서 회귀선은 이런 모습입니다 따라서 일반성 조건은 모집단에서 주어진 어떠한 x에 대해서도 예상하는 y의 분포는 정규분포를 따릅니다 x가 주어졌을 때 y에 대한 정규분포를 그릴 수 있는지 확인해 봅시다 여기 정규분포가 있습니다 이 x에 대해서 정규분포를 예상할 수 있습니다 이렇게 말이죠 이렇게 말이죠 x가 주어진다면 y의 분포는 정규분포를 따릅니다 보통 이 조건은 만족한다 하고 넘어갈 것입니다 적어도 통계학 입문에서는 여러분이 다루기에 조금 어렵기 때문이죠 다음 조건입니다 동일한(equal) 분산 조건입니다 동일한(equal) 분산 조건입니다 이는 주어진 x에 대하여 이 정규분포들이 산포도가 같아야 한다는 것이죠 따라서 분산이 같다고 할 수 있고 아니면 표준편차가 같다고 할 수 있습니다 아니면 표준편차가 같다고 할 수 있습니다 예를 들어 여기 주어진 x가 이런 모습을 나타내며 분산이 작다면 추론을 위한 조건을 만족하지 않게 되겠죠 마지막으로 우리에게 익숙한 조건입니다 임의성(random) 조건입니다 이 조건은 자료들이 잘 설계된 임의표본이나 한 무작위 실험으로부터 나왔다는 것입니다 또한 이 조건은 지금까지 추론을 위한 조건으로 모든 경우에서 쓰였습니다 그냥 넘어갈게요 LINER 알아두세요 시험에 잘 나옵니다 하지만 대부분의 경우 문제를 풀 때 통계학 입문에서는 추론을 위한 조건이 만족되었다고 가정할 것입니다 아니면 추론을 위한 조건에 무엇이 있는지 물어볼 것입니다 그러나 증명하라고는 안할 것입니다 예를 들어, 일반성 조건이나 동일한 분산조건은 통계학 입문에서 다루기엔 조금 과합니다