WEBVTT 00:00:00.180 --> 00:00:01.753 Nemrég azon kezdtünk gondolkodni, 00:00:01.753 --> 00:00:03.606 mire használható a regressziós egyenes, 00:00:03.606 --> 00:00:06.291 főként pedig annak meredeksége 00:00:06.291 --> 00:00:08.006 egy mintasokaság adatai alapján. 00:00:08.006 --> 00:00:10.860 Hogyan következtethetünk ebből 00:00:10.860 --> 00:00:15.570 az alapsokaság regressziós egyenesének a meredekségére. 00:00:15.570 --> 00:00:17.860 Ebben a videóban arról lesz szó, 00:00:17.860 --> 00:00:20.260 hogy milyen feltételekkel tehetünk következtetéseket 00:00:20.260 --> 00:00:22.536 a regressziós egyenesekre vonatkozóan. 00:00:22.536 --> 00:00:25.319 Ezeket részben már megismertük 00:00:25.319 --> 00:00:31.680 a hipotézisvizsgálatok és konfidencia intervallumok kapcsán 00:00:31.680 --> 00:00:33.920 az átlagok és arányok vizsgálata során, 00:00:33.920 --> 00:00:36.890 de lesz néhány új feltétel is. 00:00:36.890 --> 00:00:39.860 Hogy könnyebben megjegyezzük őket, 00:00:39.860 --> 00:00:46.950 használhatjuk a LINER betűszót: L-I-N-E-R. 00:00:46.950 --> 00:00:48.471 Ha esetleg nem volna egyértelmű, 00:00:48.471 --> 00:00:50.500 ez majdnem ugyanaz, mint a „lineáris”. 00:00:50.500 --> 00:00:53.040 LINER, ami egy „A” betűvel kiegészítve „lineáris” lenne. 00:00:53.040 --> 00:00:57.100 Ez nagyon hasznos, hiszen lineáris regresszióról van szó. 00:00:57.100 --> 00:01:01.240 Szóval ez az L „lineárisat” jelent. 00:01:01.240 --> 00:01:05.000 A feltétel tehát az, hogy a kapcsolat 00:01:05.000 --> 00:01:08.530 a populáció x és y változói között 00:01:08.530 --> 00:01:11.290 valóban lineáris kapcsolat legyen. 00:01:11.290 --> 00:01:20.220 Tehát a kapcsolat valóban lineáris legyen 00:01:20.220 --> 00:01:25.910 az x és y között. 00:01:25.910 --> 00:01:30.132 Sokszor eleve így feltételezzük, 00:01:30.132 --> 00:01:33.647 például egy vizsgán, mondjuk egy felvételin. 00:01:33.647 --> 00:01:36.120 Ilyenkor úgy vesszük, hogy ez a feltétel teljesül, 00:01:36.120 --> 00:01:38.502 vagy akár úgy, hogy mindegyik teljesül. 00:01:38.502 --> 00:01:41.100 A lényeg az, hogy tudd, mik ezek a feltételek. 00:01:41.100 --> 00:01:42.810 De érdemes megemlíteni, 00:01:42.810 --> 00:01:45.660 hogy ha a mögöttes kapcsolat nem lineáris, 00:01:45.660 --> 00:01:47.987 akkor előfordulhat, hogy néhány következtetés 00:01:47.987 --> 00:01:50.150 nem lesz annyira megbízható. 00:01:50.150 --> 00:01:53.200 A következő, amit már korábban is láttunk, 00:01:53.200 --> 00:01:55.740 a következtetések általános feltételeinek kapcsán, 00:01:55.740 --> 00:02:00.091 a függetlenségi feltétel (angolul independence). 00:02:00.091 --> 00:02:01.980 Ez többféleképpen értelmezhető. 00:02:01.980 --> 00:02:05.830 Vagy az egyes megfigyelések függetlenek egymástól, 00:02:05.830 --> 00:02:09.180 például a visszatevéses mintavételnél, 00:02:09.180 --> 00:02:11.910 vagy gondolhatunk a 10%-os szabályra, 00:02:11.910 --> 00:02:13.430 amiről akkor beszéltünk, 00:02:13.430 --> 00:02:18.200 amikor az átlagok és arányok függetlenségi feltételét vizsgáltuk. 00:02:18.200 --> 00:02:20.010 Itt biztosnak kell lennünk abban, 00:02:20.010 --> 00:02:23.710 hogy a mintanagyság legfeljebb 10%-a az alapsokaságnak. 00:02:23.710 --> 00:02:26.070 00:02:26.070 --> 00:02:28.140 A következő feltétel a normalitás vagy normális eloszlás, 00:02:28.140 --> 00:02:30.230 amiről már beszéltünk 00:02:30.230 --> 00:02:32.610 az átlagokra és arányokra vonatkozó következtetések kapcsán, 00:02:32.610 --> 00:02:35.170 bár amikor regresszióról beszélünk, 00:02:35.170 --> 00:02:37.580 egy kicsit összetettebb ez a feltétel. 00:02:37.580 --> 00:02:39.590 A normalitást is gyakran úgy vesszük, 00:02:39.590 --> 00:02:42.160 hogy teljesül, de 00:02:42.160 --> 00:02:43.820 rajzolok egy regressziós egyenest, 00:02:43.820 --> 00:02:44.880 és hozzáteszem a harmadik dimenziót is 00:02:44.880 --> 00:02:46.670 00:02:46.670 --> 00:02:48.410 Ez az x tengely, 00:02:48.410 --> 00:02:50.500 ez az y tengely, 00:02:50.500 --> 00:02:54.810 az alapsokaság regressziós egyenese pedig így néz ki. 00:02:54.810 --> 00:02:57.270 A normalitási feltétel azt jelenti, 00:02:57.270 --> 00:03:00.033 hogy az alapsokaságban bármely x érték esetén 00:03:00.870 --> 00:03:05.770 arra számítunk, hogy az y értékek eloszlása normális. 00:03:05.770 --> 00:03:06.603 00:03:06.603 --> 00:03:08.810 Tehát berajzolom az y értékek normális eloszlását adott x érték esetében. 00:03:08.810 --> 00:03:10.910 00:03:10.910 --> 00:03:11.870 00:03:11.870 --> 00:03:13.990 Íme a normális eloszlás. 00:03:13.990 --> 00:03:16.860 Egy másik x érték esetén is 00:03:16.860 --> 00:03:21.300 normális eloszlásra számítunk. 00:03:21.300 --> 00:03:23.460 00:03:23.460 --> 00:03:24.530 00:03:24.530 --> 00:03:25.380 Tehát adott x érték esetén az y értékek eloszlása normális. 00:03:25.380 --> 00:03:27.760 00:03:27.760 --> 00:03:29.750 Ahogy már említettem, szokszor csak feltételezzük, 00:03:29.750 --> 00:03:32.470 hogy ez teljesül, 00:03:32.470 --> 00:03:34.390 mert - legalábbis egy bevezető statisztika órán - 00:03:34.390 --> 00:03:36.970 nehéz lenne magadtól rájönni. 00:03:36.970 --> 00:03:38.810 A következő feltétel kapcsolódik ehhez, 00:03:38.810 --> 00:03:42.790 ez pedig az egyenlő variancia vagy szórásnégyzet. 00:03:42.790 --> 00:03:45.090 00:03:45.090 --> 00:03:46.390 Ez csak annyit jelent, 00:03:46.390 --> 00:03:48.670 hogy ezeknek a normális eloszlásoknak a kiterjedése 00:03:48.670 --> 00:03:51.250 00:03:51.250 --> 00:03:52.870 Ezt nevezhetjük egyenlő varianciának 00:03:52.870 --> 00:03:54.520 vagy gondolhatunk az egyenlő szórásra is. 00:03:54.520 --> 00:03:56.360 00:03:56.360 --> 00:03:59.880 Tehát például egy adott x értékre 00:03:59.880 --> 00:04:02.580 hirtelen sokkal alacsonyabb lenne a variancia, 00:04:02.580 --> 00:04:03.620 az így nézne ki, 00:04:03.620 --> 00:04:06.890 és már nem teljesülne a következtetésnek ez a feltétele. 00:04:06.890 --> 00:04:10.430 Végül, de nem utolsó sorban, és ezt már sokszor láttuk: 00:04:10.430 --> 00:04:12.300 a randomitás vagy véletlenszerűség feltétele. 00:04:12.300 --> 00:04:14.600 Ez azt jelenti, hogy az adat 00:04:14.600 --> 00:04:17.170 egy jól megtervezett random mintából származik 00:04:17.170 --> 00:04:19.200 vagy ez randomizált kísérletből. 00:04:19.200 --> 00:04:23.040 Ezt a feltételt mindegyik következtetésre vonatkozó feltételnél láttuk. 00:04:23.040 --> 00:04:25.760 00:04:25.760 --> 00:04:27.140 Szóval, erről ennyit, 00:04:27.140 --> 00:04:28.270 ezt jó tudni. 00:04:28.270 --> 00:04:30.470 Elő fog fordulni néhány vizsgán, 00:04:30.470 --> 00:04:32.960 de általában, amikor 00:04:32.960 --> 00:04:36.130 00:04:36.130 --> 00:04:38.720 00:04:38.720 --> 00:04:40.910 00:04:40.910 --> 00:04:42.970 00:04:42.970 --> 00:04:46.010 00:04:46.010 --> 00:04:47.040 00:04:47.040 --> 00:04:49.763