Nemrég azon kezdtünk gondolkodni,
mire használható a regressziós egyenes,
főként pedig annak meredeksége
egy mintasokaság adatai alapján.
Hogyan következtethetünk ebből
az alapsokaság
regressziós egyenesének a meredekségére.
Ebben a videóban arról lesz szó,
hogy milyen feltételekkel
tehetünk következtetéseket
a regressziós egyenesekre vonatkozóan.
Ezeket részben már megismertük
a hipotézisvizsgálatok
és konfidencia intervallumok kapcsán
az átlagok és arányok vizsgálata során,
de lesz néhány új feltétel is.
Hogy könnyebben megjegyezzük őket,
használhatjuk a LINER betűszót:
L-I-N-E-R.
Ha esetleg nem volna egyértelmű,
ez majdnem ugyanaz, mint a „lineáris”.
LINER, ami egy „A” betűvel kiegészítve
„lineáris” lenne.
Ez nagyon hasznos, hiszen
lineáris regresszióról van szó.
Szóval ez az L „lineárisat” jelent.
A feltétel tehát az, hogy a kapcsolat
a populáció x és y változói között
valóban lineáris kapcsolat legyen.
Tehát a kapcsolat valóban lineáris legyen
az x és y között.
Sokszor eleve így feltételezzük,
például egy vizsgán,
mondjuk egy felvételin.
Ilyenkor úgy vesszük,
hogy ez a feltétel teljesül,
vagy akár úgy, hogy mindegyik teljesül.
A lényeg az, hogy tudd,
mik ezek a feltételek.
De érdemes megemlíteni,
hogy ha a mögöttes kapcsolat nem lineáris,
akkor előfordulhat,
hogy néhány következtetés
nem lesz annyira megbízható.
A következő,
amit már korábban is láttunk,
a következtetések általános
feltételeinek kapcsán,
a függetlenségi feltétel
(angolul independence).
Ez többféleképpen értelmezhető.
Vagy az egyes megfigyelések
függetlenek egymástól,
például a visszatevéses mintavételnél,
vagy gondolhatunk a 10%-os szabályra,
amiről akkor beszéltünk,
amikor az átlagok és arányok
függetlenségi feltételét vizsgáltuk.
Itt biztosnak kell lennünk abban,
hogy a mintanagyság legfeljebb 10%-a
az alapsokaságnak.
A következő feltétel a normalitás
vagy normális eloszlás,
amiről már beszéltünk
az átlagokra és arányokra vonatkozó
következtetések kapcsán,
bár amikor regresszióról beszélünk,
egy kicsit összetettebb ez a feltétel.
A normalitást is gyakran úgy vesszük,
hogy teljesül, de
rajzolok egy regressziós egyenest,
és hozzáteszem a harmadik dimenziót is
Ez az x tengely,
ez az y tengely,
az alapsokaság regressziós egyenese pedig
így néz ki.
A normalitási feltétel azt jelenti,
hogy az alapsokaságban
bármely x érték esetén
arra számítunk, hogy az y értékek
eloszlása normális.
Tehát berajzolom az y értékek
normális eloszlását adott x érték esetében.
Íme a normális eloszlás.
Egy másik x érték esetén is
normális eloszlásra számítunk.
Tehát adott x érték esetén az
y értékek eloszlása normális.
Ahogy már említettem,
szokszor csak feltételezzük,
hogy ez teljesül,
mert - legalábbis egy bevezető
statisztika órán -
nehéz lenne magadtól rájönni.
A következő feltétel
kapcsolódik ehhez,
ez pedig az egyenlő variancia
vagy szórásnégyzet.
Ez csak annyit jelent,
hogy ezeknek a normális eloszlásoknak
a kiterjedése
Ezt nevezhetjük egyenlő varianciának
vagy gondolhatunk
az egyenlő szórásra is.
Tehát például egy adott x értékre
hirtelen sokkal alacsonyabb lenne
a variancia,
az így nézne ki,
és már nem teljesülne
a következtetésnek ez a feltétele.
Végül, de nem utolsó sorban,
és ezt már sokszor láttuk:
a randomitás vagy véletlenszerűség
feltétele.
Ez azt jelenti, hogy az adat
egy jól megtervezett random mintából
származik
vagy ez randomizált kísérletből.
Ezt a feltételt mindegyik következtetésre
vonatkozó feltételnél láttuk.
Szóval, erről ennyit,
ezt jó tudni.
Elő fog fordulni néhány vizsgán,
de általában, amikor