0:00:00.180,0:00:01.753 Nemrég azon kezdtünk gondolkodni, 0:00:01.753,0:00:03.606 mire használható a regressziós egyenes, 0:00:03.606,0:00:06.291 főként pedig annak meredeksége 0:00:06.291,0:00:08.006 egy mintasokaság adatai alapján. 0:00:08.006,0:00:10.860 Hogyan következtethetünk ebből 0:00:10.860,0:00:15.570 az alapsokaság[br]regressziós egyenesének a meredekségére. 0:00:15.570,0:00:17.860 Ebben a videóban arról lesz szó, 0:00:17.860,0:00:20.260 hogy milyen feltételekkel[br]tehetünk következtetéseket 0:00:20.260,0:00:22.536 a regressziós egyenesekre vonatkozóan. 0:00:22.536,0:00:25.319 Ezeket részben már megismertük 0:00:25.319,0:00:31.680 a hipotézisvizsgálatok[br]és konfidencia intervallumok kapcsán 0:00:31.680,0:00:33.920 az átlagok és arányok vizsgálata során, 0:00:33.920,0:00:36.890 de lesz néhány új feltétel is. 0:00:36.890,0:00:39.860 Hogy könnyebben megjegyezzük őket, 0:00:39.860,0:00:46.950 használhatjuk a LINER betűszót:[br]L-I-N-E-R. 0:00:46.950,0:00:48.471 Ha esetleg nem volna egyértelmű, 0:00:48.471,0:00:50.500 ez majdnem ugyanaz, mint a „lineáris”. 0:00:50.500,0:00:53.040 LINER, ami egy „A” betűvel kiegészítve[br]„lineáris” lenne. 0:00:53.040,0:00:57.100 Ez nagyon hasznos, hiszen[br]lineáris regresszióról van szó. 0:00:57.100,0:01:01.240 Szóval ez az L „lineárisat” jelent. 0:01:01.240,0:01:05.000 A feltétel tehát az, hogy a kapcsolat 0:01:05.000,0:01:08.530 a populáció x és y változói között 0:01:08.530,0:01:11.290 valóban lineáris kapcsolat legyen. 0:01:11.290,0:01:20.220 Tehát a kapcsolat valóban lineáris legyen 0:01:20.220,0:01:25.910 az x és y között. 0:01:25.910,0:01:30.132 Sokszor eleve így feltételezzük, 0:01:30.132,0:01:33.647 például egy vizsgán,[br]mondjuk egy felvételin. 0:01:33.647,0:01:36.120 Ilyenkor úgy vesszük,[br]hogy ez a feltétel teljesül, 0:01:36.120,0:01:38.502 vagy akár úgy, hogy mindegyik teljesül. 0:01:38.502,0:01:41.100 A lényeg az, hogy tudd,[br]mik ezek a feltételek. 0:01:41.100,0:01:42.810 De érdemes megemlíteni, 0:01:42.810,0:01:45.660 hogy ha a mögöttes kapcsolat nem lineáris, 0:01:45.660,0:01:47.987 akkor előfordulhat,[br]hogy néhány következtetés 0:01:47.987,0:01:50.150 nem lesz annyira megbízható. 0:01:50.150,0:01:53.200 A következő,[br]amit már korábban is láttunk, 0:01:53.200,0:01:55.740 a következtetések általános[br]feltételeinek kapcsán, 0:01:55.740,0:02:00.091 a függetlenségi feltétel[br](angolul independence). 0:02:00.091,0:02:01.980 Ez többféleképpen értelmezhető. 0:02:01.980,0:02:05.830 Vagy az egyes megfigyelések[br]függetlenek egymástól, 0:02:05.830,0:02:09.180 például a visszatevéses mintavételnél, 0:02:09.180,0:02:11.910 vagy gondolhatunk a 10%-os szabályra, 0:02:11.910,0:02:13.430 amiről akkor beszéltünk, 0:02:13.430,0:02:18.200 amikor az átlagok és arányok[br]függetlenségi feltételét vizsgáltuk. 0:02:18.200,0:02:20.010 Itt biztosnak kell lennünk abban, 0:02:20.010,0:02:23.710 hogy a mintanagyság legfeljebb 10%-a[br]az alapsokaságnak. 0:02:23.710,0:02:26.070 0:02:26.070,0:02:28.140 A következő feltétel a normalitás[br]vagy normális eloszlás, 0:02:28.140,0:02:30.230 amiről már beszéltünk 0:02:30.230,0:02:32.610 az átlagokra és arányokra vonatkozó[br]következtetések kapcsán, 0:02:32.610,0:02:35.170 bár amikor regresszióról beszélünk, 0:02:35.170,0:02:37.580 egy kicsit összetettebb ez a feltétel. 0:02:37.580,0:02:39.590 A normalitást is gyakran úgy vesszük, 0:02:39.590,0:02:42.160 hogy teljesül, de 0:02:42.160,0:02:43.820 rajzolok egy regressziós egyenest, 0:02:43.820,0:02:44.880 és hozzáteszem a harmadik dimenziót is 0:02:44.880,0:02:46.670 0:02:46.670,0:02:48.410 Ez az x tengely, 0:02:48.410,0:02:50.500 ez az y tengely, 0:02:50.500,0:02:54.810 az alapsokaság regressziós egyenese pedig[br]így néz ki. 0:02:54.810,0:02:57.270 A normalitási feltétel azt jelenti, 0:02:57.270,0:03:00.033 hogy az alapsokaságban[br]bármely x érték esetén 0:03:00.870,0:03:05.770 arra számítunk, hogy az y értékek[br]eloszlása normális. 0:03:05.770,0:03:06.603 0:03:06.603,0:03:08.810 Tehát berajzolom az y értékek[br]normális eloszlását adott x érték esetében. 0:03:08.810,0:03:10.910 0:03:10.910,0:03:11.870 0:03:11.870,0:03:13.990 Íme a normális eloszlás. 0:03:13.990,0:03:16.860 Egy másik x érték esetén is 0:03:16.860,0:03:21.300 normális eloszlásra számítunk. 0:03:21.300,0:03:23.460 0:03:23.460,0:03:24.530 0:03:24.530,0:03:25.380 Tehát adott x érték esetén az[br]y értékek eloszlása normális. 0:03:25.380,0:03:27.760 0:03:27.760,0:03:29.750 Ahogy már említettem,[br]szokszor csak feltételezzük, 0:03:29.750,0:03:32.470 hogy ez teljesül, 0:03:32.470,0:03:34.390 mert - legalábbis egy bevezető[br]statisztika órán - 0:03:34.390,0:03:36.970 nehéz lenne magadtól rájönni. 0:03:36.970,0:03:38.810 A következő feltétel[br]kapcsolódik ehhez, 0:03:38.810,0:03:42.790 ez pedig az egyenlő variancia[br]vagy szórásnégyzet. 0:03:42.790,0:03:45.090 0:03:45.090,0:03:46.390 Ez csak annyit jelent, 0:03:46.390,0:03:48.670 hogy ezeknek a normális eloszlásoknak[br]a kiterjedése 0:03:48.670,0:03:51.250 0:03:51.250,0:03:52.870 Ezt nevezhetjük egyenlő varianciának 0:03:52.870,0:03:54.520 vagy gondolhatunk[br]az egyenlő szórásra is. 0:03:54.520,0:03:56.360 0:03:56.360,0:03:59.880 Tehát például egy adott x értékre 0:03:59.880,0:04:02.580 hirtelen sokkal alacsonyabb lenne[br]a variancia, 0:04:02.580,0:04:03.620 az így nézne ki, 0:04:03.620,0:04:06.890 és már nem teljesülne[br]a következtetésnek ez a feltétele. 0:04:06.890,0:04:10.430 Végül, de nem utolsó sorban,[br]és ezt már sokszor láttuk: 0:04:10.430,0:04:12.300 a randomitás vagy véletlenszerűség[br]feltétele. 0:04:12.300,0:04:14.600 Ez azt jelenti, hogy az adat 0:04:14.600,0:04:17.170 egy jól megtervezett random mintából[br]származik 0:04:17.170,0:04:19.200 vagy ez randomizált kísérletből. 0:04:19.200,0:04:23.040 Ezt a feltételt mindegyik következtetésre[br]vonatkozó feltételnél láttuk. 0:04:23.040,0:04:25.760 0:04:25.760,0:04:27.140 Szóval, erről ennyit, 0:04:27.140,0:04:28.270 ezt jó tudni. 0:04:28.270,0:04:30.470 Elő fog fordulni néhány vizsgán, 0:04:30.470,0:04:32.960 de általában, amikor 0:04:32.960,0:04:36.130 0:04:36.130,0:04:38.720 0:04:38.720,0:04:40.910 0:04:40.910,0:04:42.970 0:04:42.970,0:04:46.010 0:04:46.010,0:04:47.040 0:04:47.040,0:04:49.763