Nemrég azon kezdtünk gondolkodni, mire használható a regressziós egyenes, főként pedig annak meredeksége egy mintasokaság adatai alapján. Hogyan következtethetünk ebből az alapsokaság regressziós egyenesének a meredekségére. Ebben a videóban arról lesz szó, hogy milyen feltételekkel tehetünk következtetéseket a regressziós egyenesekre vonatkozóan. Ezeket részben már megismertük a hipotézisvizsgálatok és konfidencia intervallumok kapcsán az átlagok és arányok vizsgálata során, de lesz néhány új feltétel is. Hogy könnyebben megjegyezzük őket, használhatjuk a LINER betűszót: L-I-N-E-R. Ha esetleg nem volna egyértelmű, ez majdnem ugyanaz, mint a „lineáris”. LINER, ami egy „A” betűvel kiegészítve „lineáris” lenne. Ez nagyon hasznos, hiszen lineáris regresszióról van szó. Szóval ez az L „lineárisat” jelent. A feltétel tehát az, hogy a kapcsolat a populáció x és y változói között valóban lineáris kapcsolat legyen. Tehát a kapcsolat valóban lineáris legyen az x és y között. Sokszor eleve így feltételezzük, például egy vizsgán, mondjuk egy felvételin. Ilyenkor úgy vesszük, hogy ez a feltétel teljesül, vagy akár úgy, hogy mindegyik teljesül. A lényeg az, hogy tudd, mik ezek a feltételek. De érdemes megemlíteni, hogy ha a mögöttes kapcsolat nem lineáris, akkor előfordulhat, hogy néhány következtetés nem lesz annyira megbízható. A következő, amit már korábban is láttunk, a következtetések általános feltételeinek kapcsán, a függetlenségi feltétel (angolul independence). Ez többféleképpen értelmezhető. Vagy az egyes megfigyelések függetlenek egymástól, például a visszatevéses mintavételnél, vagy gondolhatunk a 10%-os szabályra, amiről akkor beszéltünk, amikor az átlagok és arányok függetlenségi feltételét vizsgáltuk. Itt biztosnak kell lennünk abban, hogy a mintanagyság legfeljebb 10%-a az alapsokaságnak. A következő feltétel a normalitás vagy normális eloszlás, amiről már beszéltünk az átlagokra és arányokra vonatkozó következtetések kapcsán, bár amikor regresszióról beszélünk, egy kicsit összetettebb ez a feltétel. A normalitást is gyakran úgy vesszük, hogy teljesül, de rajzolok egy regressziós egyenest, és hozzáteszem a harmadik dimenziót is Ez az x tengely, ez az y tengely, az alapsokaság regressziós egyenese pedig így néz ki. A normalitási feltétel azt jelenti, hogy az alapsokaságban bármely x érték esetén arra számítunk, hogy az y értékek eloszlása normális. Tehát berajzolom az y értékek normális eloszlását adott x érték esetében. Íme a normális eloszlás. Egy másik x érték esetén is normális eloszlásra számítunk. Tehát adott x érték esetén az y értékek eloszlása normális. Ahogy már említettem, szokszor csak feltételezzük, hogy ez teljesül, mert - legalábbis egy bevezető statisztika órán - nehéz lenne magadtól rájönni. A következő feltétel kapcsolódik ehhez, ez pedig az egyenlő variancia vagy szórásnégyzet. Ez csak annyit jelent, hogy ezeknek a normális eloszlásoknak a kiterjedése Ezt nevezhetjük egyenlő varianciának vagy gondolhatunk az egyenlő szórásra is. Tehát például egy adott x értékre hirtelen sokkal alacsonyabb lenne a variancia, az így nézne ki, és már nem teljesülne a következtetésnek ez a feltétele. Végül, de nem utolsó sorban, és ezt már sokszor láttuk: a randomitás vagy véletlenszerűség feltétele. Ez azt jelenti, hogy az adat egy jól megtervezett random mintából származik vagy ez randomizált kísérletből. Ezt a feltételt mindegyik következtetésre vonatkozó feltételnél láttuk. Szóval, erről ennyit, ezt jó tudni. Elő fog fordulni néhány vizsgán, de általában, amikor