-
여기 지금 보이는 것은
-
칸아카데미 사용자 중 한 명인
샬롯 오엔이 만든 코드입니다
-
칸아카데미 사용자 중 한 명인
샬롯 오엔이 만든 코드입니다
-
이 코드를 통해 풍선껌 자판기에서 얻어지는
표본분포를 시뮬레이션 할 수 있습니다
-
이 코드를 통해 풍선껌 자판기에서 얻어지는
표본분포를 시뮬레이션 할 수 있습니다
-
표본비율의 표본분포를 어림할 수 있죠
-
표본비율의 표본분포를 어림할 수 있죠
-
샬롯이 만든 시뮬레이션은
초록색 풍선껌의 비율을 이용하는데
-
전 동영상에서는 이전에 60%의
노란색 풍선껌에 대한 문제를 풀었습니다
-
이 시뮬레이션에 맞춰 이제
60%의 초록색 풍선껌을 가정합시다
-
이제 이전에 했던대로
표본 크기는 10으로 지정하고
-
이제 이전에 했던대로
표본 크기는 10으로 지정하고
-
먼저 1개의 표본부터 시작해 봅시다
-
이제 10개의 풍선껌을 뽑아서
-
이 표본에서 초록색 풍선껌의 비율을
구할 것입니다
-
이 표본에서 초록색 풍선껌의 비율을
구할 것입니다
-
첫 10개의 표본에서
5개의 초록색 껌을 뽑았습니다
-
그러면 여기 50% 지점에 점이 찍힐 것입니다
-
그러면 여기 50% 지점에 점이 찍힐 것입니다
-
50%의 초록색 풍선껌을 가지는
표본 1개를 뽑았습니다
-
이제 다른 표본을 뽑아 봅시다
이번에는 70%가 초록색입니다
-
계속 반복해 보겠습니다
-
다른 표본을 뽑으면
-
이번에는 50%가 초록색이네요
-
여기에서 뽑은 표본들의 분포를
확인할 수 있습니다
-
두 개의 표본에서 50%가 초록색이었죠
-
표본을 계속 뽑으면
그래프 상에 점이 증가합니다
-
표본을 계속 뽑으면
그래프 상에 점이 증가합니다
-
이제 10개의 풍선껌 표본을
50개 뽑아 보겠습니다
-
그러면 조금 더 빨리
더 많은 수의 표본분포를 볼 수 있겠죠
-
그러면 조금 더 빨리
더 많은 수의 표본분포를 볼 수 있겠죠
-
이제 1000개가 넘는 표본을 가지고 있습니다
-
여기서 재밌는 것은
이제 실험적으로
-
여기서 재밌는 것은
이제 실험적으로
-
표본이 갖는 표본비율의 평균값이
0.62임을 확인할 수 있다는 것입니다
-
표본이 갖는 표본비율의 평균값이
0.62임을 확인할 수 있다는 것입니다
-
몇 분 전에 이 평균값이
0.62이어야 한다고 계산했죠
-
몇 분 전에 이 평균값이
0.62이어야 한다고 계산했죠
-
뿐만 아니라 표준편차 또한
여기서 0.16으로 확인할 수 있는데
-
뿐만 아니라 표준편차 또한
여기서 0.16으로 확인할 수 있는데
-
계산한 값은 대략 0.15였습니다
-
계산한 값은 대략 0.15였습니다
-
더 많은 표본을 채취하면 채취할수록
계산한 값에 가까워집니다
-
더 많은 표본을 채취하면 채취할수록
계산한 값에 가까워집니다
-
점점 계산값에 가까워져서
이제는 어림값이 같아졌습니다
-
점점 계산값에 가까워져서
이제는 어림값이 같아졌습니다
-
점점 계산값에 가까워져서
이제는 어림값이 같아졌습니다
-
점점 계산값에 가까워져서
이제는 어림값이 같아졌습니다
-
또 하나 여기서 짚고 넘어갈 것은
-
모수가 0이나 1에 너무 가깝지 않으면
-
모수가 0이나 1에 너무 가깝지 않으면
-
이 분포는 대략 정규분포 모양을
따른다는 것입니다
-
이미 공부한 표본비율의 표본분포와
이항확률변수의 관계를 생각하면
-
이미 공부한 표본비율의 표본분포와
이항확률변수의 관계를 생각하면
-
이미 공부한 표본비율의 표본분포와
이항확률변수의 관계를 생각하면
-
쉽게 이해가 가능합니다
-
하지만 만약 모수의 값이
0에 가까운 값이면 어떻게 될까요?
-
예를 들어 모수가 10%라고 합시다
-
즉 0.1 입니다
-
분포의 모양이 어떻게 될까요?
-
이미 표본분포의
평균값이 10%라는 것을 알고 있습니다
-
따라서 분포 모양이 오른쪽으로
왜곡될 것이라는 것을 예측할 수 있을 겁니다
-
따라서 분포 모양이 오른쪽으로
왜곡될 것이라는 것을 예측할 수 있을 겁니다
-
이제 실제로 그렇게 되는지 확인해 봅시다
-
여기 얻어진 표본분포를 보면
실제로 오른쪽으로 왜곡되어 있습니다
-
여기 얻어진 표본분포를 보면
실제로 오른쪽으로 왜곡되어 있습니다
-
이 또한 쉽게 이해가 가능한데
-
얻을 수 있는 값은 0부터 1 사이이고
-
평균값이 0에 가깝다면
표본값도 대부분 0에 가까운 값일 것이므로
-
평균값이 0에 가깝다면
표본값도 대부분 0에 가까운 값일 것이므로
-
오른쪽으로 긴 꼬리를 보일 것입니다
-
즉 오른쪽으로 왜곡된 그래프이죠
-
만약 모수가 1에 가깝다면
-
그래프 모양이 반대가 될 것입니다
-
즉 왼쪽으로 왜곡된 그래프가 그려질 것입니다
-
실제로 이 시뮬레이션에서
왼쪽으로 왜곡된 그래프를 확인할 수 있습니다
-
또 하나 확인할 수 있는 흥미로운 점은
-
표본의 크기가 커질수록
표준편차가 작아진다는 것입니다
-
먼저 모수를 정확히 중앙값으로 설정하면
-
먼저 모수를 정확히 중앙값으로 설정하면
-
대략 정규분포에 가까운
그래프 모양을 확인할 수 있습니다
-
대략 정규분포에 가까운
그래프 모양을 확인할 수 있습니다
-
이제 표본 크기를 10에서
50으로 늘리면 어떻게 될까요?
-
이제 표본 크기를 10에서
50으로 늘리면 어떻게 될까요?
-
표본분포의 폭이 더 좁아진 것을
확인할 수 있습니다
-
물론 한 개의 점으로 수렴하는 것은 아니지만
전에 비해 훨씬 좁은 모양을 보입니다
-
물론 한 개의 점으로 수렴하는 것은 아니지만
전에 비해 훨씬 좁은 모양을 보입니다
-
이는 표본비율의 표준편차는
-
이는 표본비율의 표준편차는
-
표본 크기 n의 제곱근 값에
반비례한다는 사실로 설명이 가능합니다
-
표본 크기 n의 제곱근 값에
반비례한다는 사실로 설명이 가능합니다
-
이 시뮬레이션을 통해
표본비율의 표본분포에 대한
-
이 시뮬레이션을 통해
표본비율의 표본분포에 대한
-
좋은 직관적 이해를 얻어갈 수 있길 바랍니다
-
그리고 그 평균과 표준편차를 구하는 방법도요
-
시뮬레이션을 통해 직접 확인을 했으니
더 이해하기 편할 겁니다
-
시뮬레이션을 통해 직접 확인을 했으니
더 이해하기 편할 겁니다