-
İstatistikler hakkındaki sunuma hoş geldiniz.
-
Bu videoyu uzun bir zamandır yapmayı düşünüyordum.
-
Evet, şimdi uzatmadan konuya girip
-
çözebildiğim kadar örnek çözüp
-
istatistikler hakkında bir fikriniz olsun istiyorum.
-
Eğer bu konuyla ilgili
-
pek alakanız yoksa - ama bence birsürü kişi bu konuyu
-
az çok biliyordur - basitçe başlayalım.
-
Ve temel olarak istatistik
-
elinizdeki verileri analiz edebilmektir.
-
Ve çok farklı konulara ayrılabilir.
-
3 farklı kategori var.
-
1. kategori tanımlayıcı.
-
Diyelim ki elinizde çok fazla veri var ve birine
-
bu veriyi tamamen vermeden anlatmak istiyorsunuz.
-
Belki belirleyici bir kaç sayı
-
kullanarak bütün veriyi açıklamadan
-
elinizdeki verileri anlatabilirsiniz.
-
Bunlar tanımlayıcı istatistikler oluyor.
-
2. Kategori öngörüsel istatistikler
-
İkisini beraber alayım
-
3. sü de çıkarımsal istatistikler.
-
Bu da veriyi
-
sonuçlara ulaşmak için kullandığınız zaman oluyor.
-
Diyelim ki bir nüfustan veri çıkardınız.
-
ve örneklerle nüfuslar arasındaki farkı da konuşacağız
-
ama şu an ne olup bittiğini anladınız dimi?
-
Eğer oy başkanlık seçimi için oy vericek
-
sadece üç kişiyi sorgularsam, bütün nüfusu sorgulamamış olurum.
-
Sadece bir örneği sorgulamışımdır
-
Ama çıkarımsal istatistikler
-
örnekler üzerinden yaptığımız çıkarımlar ile
-
bütün nüfus hakkında bir sonuca ulaşmak ile ilgilidir.
-
Herneyse, bu sadece istastiğin
-
küçük bir bölümü.
-
Biz direkt olarak tanımlayıcı
-
istatistiklerin matematiğine girelim.
-
Şimdi, bana bir sayı kümesi verildiğinde
-
benim yapmak istediğim, daha doğrusu birçok kişinin yapmak isteyeceğini düşündüğüm ilk şey
-
bu kümeyi tanımlamaktır.
-
Belki kümedeki sayıları en iyi
-
tanımlayan sayıyı bulabilirim.
-
Ya da kümenin "merkezi eğilimini" gösteren bir sayı.
-
Merkezi eğilimi istatistik kitaplarında çok görürsünüz.
-
Bir kümenin merkezi eğilimi,
-
ki buna averajı da denir,
-
Burada averaj kelimesiyle normalde
-
olduğumdan daha kesin olacağım. Burada averajdan bahsettiğimde
-
kümenin merkezi eğilimi hakkında
-
bize bir fikir veren sayıdan bahsediyor olacağım.
-
Ya da kümedeki sayıları en iyi temsil eden sayı.
-
Bunların çok soyut kavramlar geldiğini biliyorum
-
ama birkaç örnek çözelim.
-
Averaj ya da merkezi eğilimi bulmanın
-
birkaç farklı yolu var.
-
ve bunları büyük ihtimalle daha önce gördünüz.
-
Bunlar ortalamadır.
-
Ve ortalamanın farklı versiyonları var
-
ama biz aritmetik ortalama,
-
geometrik ortalama ve belki bir gün
-
harmonik ortalamayı yapacağız.
-
Ortalama, medyan ve mod vardır.
-
Ve istatistikler dilinde
-
bunların hepsi elinizdeki verinin bir temsilcisi veya
-
merkezi eğiliminin bir göstergesi olabilir.
-
Ve bunların hepsi beraber
-
averajın biçimleridir.
-
Ve bana göre, birkaç örnek çözünce
-
bunların hepsi size biraz daha mantıklı gelecek.
-
Günlük konuşmada, insanlar averaj hakkında konuştuklarında - ki bence
-
şu ana kadar averaj hesapladıığınız olmuştur - onlar
-
genelde aritmetik ortalamadan bahsederler.
-
Yani biri "şu sayıların
-
averajını hesaplayalım" dedikerinde sizde
-
artimetik ortalamayı hesaplamanızı isterler.
-
Medyan veya mod u bulmanızı istemezler.
-
Ama daha fazla ilerlemeden,
-
bunların neler olduklarını öğrenelim.
-
Bir sayı kümesi oluşturayım.
-
Diyelim ki bir 1'im var.
-
bir tane daha 1, bir tane 2, bir tane 3 üm var.
-
Bir tane de 4 üm olsun.
-
Bu yeterince iyi.
-
Basit bir örnek istiyoruz.
-
Averaj hakkında konuştuğumuzda
-
insanların aklına gelen ilk şey ortalama olur.
-
Temel olarak bu, bütün sayıları toplayıp
-
kaç tane sayı varsa o sayıya bölmektir.
-
Bu durumda 1+1+2+3 işlemini yapıp
-
Kaç tane sayı varsa o sayıya bölmek olacak - 1, 2, 3
-
4, 5 sayımız var.
-
Yani kaç ediyor?
-
1+1=2.
-
2+2=4.
-
4+3=7
-
7+4=11
-
Yani bu 11/5 e eşit
-
Bu da...
-
2 tam 1/5 e eşit
-
Yani 2.2
-
Bunu hesaplayan biri
-
"Bu sayı bu kümeyi tanımlayacak
-
iyi bir sayı.
-
Bu sayı diger butun sayıların en yakın oldukları sayı"
-
Ya da 2.2 bu kümenin merkezi eğilimini
-
gösteren sayı.
-
Ve günlük dilde bu averaj olur.
-
Ama ayrıntılara biraz daha dikkat edersek,
-
bu sayı kümenin artimetik ortalamasıdır.
-
Ve görebilirsiniz ki bu kümeyi tanımlayan bir sayı.
-
Eğer size kümedeki sayıların listesini vermesem,
-
"elimde 5 tane sayı var ve ortalamaları 2.2" desem
-
size küme hakkında biraz
-
bilgi veriyor.
-
Bir sonraki videoda bu sayıların
-
ortalamadan ne kadar uzak olduklarını konuşacağız.
-
Şimdi elimizde bir ölçü var.
-
Başka bir averaj alma biçimi
-
sayıları sıralayarak oluyor.
-
Ki ben bunu zaten yaptım.
-
Yine de bir daha sırayla yazalım.
-
1, 1, 2, 3, 4
-
Ve en ortadaki sayıyı alıyoruz.
-
Görüyorsunuz ki elimizde 5 sayı var
-
bu da demek ki en ortadaki sayı tam burada olacak, dimi?
-
2.
-
2den büyük iki sayı ve 2den küçük
-
iki sayı var.
-
Ve biz bu sayıya medyan diyoruz.
-
Ve burada çok az hesaplama var.
-
Yaptığınız şey sayıları sıralamak.
-
Ve sonra en
-
ortadaki sayıyı buluyorsunuz
-
Yani bu kümenin medyanı 2.
-
Ve gördüğünüz gibi
-
bu aritmetik ortalamaya gayet yakın.
-
Ve tam bir kesinlik yok -
-
bunların hiçbiri averaj için daha iyi bir açıklama değil.
-
Sadece averaj hesaplamanın farklı yolları.
-
Ve işte bu da medyandı.
-
Ve "5 sayımız vardı, tabi
-
kolay olucak" dediğinizi biliyorum.
-
6 sayı olsaydı ne yapıcaktık?
-
Kümemiz bu olsaydı,
-
- bir tane daha 4 ekleyelim -
-
şimdi en ortadaki sayı diye bir şey yok dimi?
-
2 ortadaki sayı sayılmaz çünkü
-
ikiden küçük 2 sayı, ikiden büyük 3 sayı var.
-
3 de değil çünkü 3 ten büyük 3 - pardon
-
üçten büyük 2 sayı ve üçten küçük
-
3 sayı var.
-
Yani ortanca sayı yok.
-
Yani çift sayıda elemanı olan bir kümeniz olduğunda
-
medyanı bulmanız gerektiğinde
-
yapmanız gereken ortadaki iki sayının
-
aritmetik ortalamasını almak.
-
Bu durumda medyanımız 2.5
-
Tamam.
-
Ama bunu kenarad bırakalım çünkü
-
tek bir küme için medyanı, aritmetik ortalamayı ve modu karşılaştırmak
-
istiyorum.
-
Ama bu bilinmesi gerek bir şey çünkü
-
bazen iş biraz karışabiliyor.
-
Ve bunların hepsi tanımlar.
-
Bunların hepsi sayıların içinden anlam çıkarmak için
-
kullandığımız matematiksel araçlar.
-
Kimse bir gün güneşin üstünde bir formül görüp
-
"Ah, bu evrenin bir parçası
-
ve averaj böyle hesaplanır" demedi.
-
Bunların hepsi insan yapımı araçlar ve amaçları
-
da veriyi daha anlaşılabilir hale getirmek.
-
Bu pek büyük bir küme değil ama 5 yerine
-
5 milyon sayımız olsaydı,
-
her sayıyı tek tek düşünmenin zor olabileceğini anlamışsınızdır.
-
Her neyse, bunun hakkında daha fazla konuşmadan size
-
mod un ne olduğunu anlatayım.
-
Bana göre mod insanların ya hiç öğrenmediği
-
ya da en kolay farkettikleri oluyor.
-
Sınavda mod gördüklerinde
-
"Bu üst seviye gözüküyor" dedirtiyor ama aslında
-
averaj / merkezi eğilim hesaplamalarından bana göre en kolayı.
-
Mod bir sayı kümesinde en çok tekrarlanan sayıdır.
-
Bu örnekte iki tane 1 imiz ve geri kalan her
-
sayıdan sadece birer tane var, dimi?
-
Yani buradaki mod 1.
-
Yani mod en sık görülen sayı.
-
Sonra siz de "Hey, Sal,
-
eğer kümemiz bu olsaydı?
-
1, 1, 2, 3, 4, 4." Burada iki tane 1 ve iki tane 4 var.
-
Ve işte mod burada biraz karışıyor çünkü
-
bu sayılardan ikisi de mod için doğru bir cevap olurdu.
-
"Mod=1" veya
-
"Mod=4" diyebilirdiniz. Ve burada biraz belirsizleşiyor.
-
Ve size soru sorandan biraz
-
açıklık istediğinizi tahmin ediyorum
-
Sınavlarda size sorduklarında genelde
-
böyle bir belirsizlik olmaz.
-
Kümede sadece 1 tane en çok tekrarlanan sayı olur.
-
Şimdi hepsini bildiğinize göre,
-
"neden bunlardan biri yetmiyordu?" dediğinizi düşünüyorum.
-
"Neden bunların hepsini kullanıyoruz?"
-
dediğinizi görebiliyorum.
-
"Neden sadece aritmetik ortalamayı kullanmıyoruz?"
-
"Medyan ve mod ne işe yarıyor?"
-
Bir örnek çözüp
-
size bunu anlatmaya çalışacağım.
-
Sonra da biraz daha düşünebilirsiniz.
-
Diyelim ki, kümemiz
-
3, 3, 3, 3, 3, ve ne biliyim, 100. olsun.
-
Burada aritmetik ortalama kac?
-
5 tane 3 üm ve 100 üm var.
-
Yani aritmetik ortalamam 115/6 degil mi?
-
.
-
115 bu sayıların toplamı.
-
115 in içinde kaç kere altı var.
-
6 da bir kere var.
-
1*6=6.
-
55 de 9 kere var.
-
9*6=54
-
yani 19 tam 1/6 eder.
-
Tamam.
-
Bütün sayıları toplayıp
-
sayıların sayısına böldüm.
-
Ama size sorum, sizce bu sayı bu kümeyi
-
tanımlıyor mu?
-
Bir sürü 3 üm var bir de 100 var
-
ama birden merkezi eğilime 19 tam 1/6 diyoruz.
-
Bence 19 tam 1/6 kümeyi
-
pek tanıtmıyor.
-
Yani belki iyi tanımlıyordur - sizin nasıl kullandığınızı bilmiyorum - ama
-
sanki biraz alakasız dimi?
-
Bana göre merkezi eğilim
-
3 e daha yakın bir şey olurdu çünkü burada bir sürü 3 var.
-
Median bize ne derdi?
-
Bu sayılar zaten sıralı değil mi?
-
Size sayıları karışık olarak verseydim,
-
siz bu sıraya koyup ortadaki sayının kaç olduğunu söylerdiniz?
-
Kümede çift sayıda sayı olduğu için ortadaki iki sayıyı alıyorum -
-
3 ve 3 -
-
ve bunların averajını aldığımda
-
- pardon doğrusunu söyleyeyim -
-
bunların aritmetik ortalamasını aldığımda cevap 3.
-
Ve belki bu merkezi eğilimin biraz daha iyi bir göstergesi
-
oluyor dimi?
-
Medyanı aldığımda kümedeki
-
aşırı büyük farklı sayıdan
-
o kadar çok etkilenmedim.
-
İstatistiklerde bu sayıya aykırı sayı denir.
-
Öyle bir sayı ki, mesela ev fiyatları hakkında konuşurken,
-
şehirdeki her ev 100,000$ ve
-
bir tane de 1 trilyon $ lık bir ev var.
-
Ve biri size ortalama ev fiyatını sorsa,
-
elde ettiğiniz sayı yüzünden
-
o şehirle ilgili yanlış bir algıya kapılabilirsiniz.
-
Ama medyan ev değeri 100,000$
-
ve size şehirdeki evler hakkında daha iyi bir fikir veriyor.
-
Yani burada medyan,
-
kümedeki sayılar hakkında size daha iyi bir tanım veriyor.
-
Çünkü aritmetik ortalama
-
bu aykırı sayı yüzünden çok etkilendi.
-
Ve bu aykırı sayıları
-
bir istatistikçinin "gördüğümde anlarım"
-
dediği şeylerden biridir.
-
Resmi bir tanımı yok ama genelde
-
kümedeki diğer sayılardan çok farklı olan,
-
bazen bir ölçüm hatası nedeniyle ortaya çıkan sayılardan biridir.
-
Ve son olarak, mod.
-
Bu kümede en sık görülen sayı kaç?
-
5 tane 3 ümüz ve 1 tane 100 ümüz var.
-
En sık görülen sayı 3.
-
Bu durumda, bir aykırı sayı varken, medyan ve
-
mod kümeyi daha
-
iyi tanımlayan
-
ölçüm biçimleri oluyor.
-
Belki bu bir ölçüm hatasıydı.
-
Ama bu sayıların neyi gösterdiğini
-
tam bilmiyoruz.
-
Eğer bunlar ev fiyatları olsalardı,
-
medyan ve mod o bölgedeki ev fiyatları hakkında
-
daha iyi bir fikir verirlerdi.
-
Ama eğer bu bir sınavın sonuçlarıysa,
-
belki sınıfta bir çocuk diğerlerinden daha
-
iyi çalıştı ve başka hiç kimse
-
çalışmadı.
-
Burada da medyan ve mod çocukların genel olarak
-
nasıl gittiklerini daha iyi gösteriyor.
-
Her neyse, benim bu konu hakkında konuşmam bitti.
-
Hepinizi sayılarla biraz oynayıp
-
konseptleri çözmeye davet ediyorum.
-
Bir sonraki videoda, tanımlayıcı istatistiklere
-
devam edeceğiz.
-
Merkezi eğilim yerine
-
verilerin merkezi eğilimden ne kadar
-
uzak olduklarını konuşacağız.
-
Bir sonraki videoda görüşmek üzere.