1 00:00:00,180 --> 00:00:01,753 Nemrég azon kezdtünk gondolkodni, 2 00:00:01,753 --> 00:00:03,606 mire használható a regressziós egyenes, 3 00:00:03,606 --> 00:00:06,291 főként pedig annak meredeksége 4 00:00:06,291 --> 00:00:08,006 egy mintasokaság adatai alapján. 5 00:00:08,006 --> 00:00:10,860 Hogyan következtethetünk ebből 6 00:00:10,860 --> 00:00:15,570 az alapsokaság regressziós egyenesének a meredekségére. 7 00:00:15,570 --> 00:00:17,860 Ebben a videóban arról lesz szó, 8 00:00:17,860 --> 00:00:20,260 hogy milyen feltételekkel tehetünk következtetéseket 9 00:00:20,260 --> 00:00:22,536 a regressziós egyenesekre vonatkozóan. 10 00:00:22,536 --> 00:00:25,319 Ezeket részben már megismertük 11 00:00:25,319 --> 00:00:31,680 a hipotézisvizsgálatok és konfidencia intervallumok kapcsán 12 00:00:31,680 --> 00:00:33,920 az átlagok és arányok vizsgálata során, 13 00:00:33,920 --> 00:00:36,890 de lesz néhány új feltétel is. 14 00:00:36,890 --> 00:00:39,860 Hogy könnyebben megjegyezzük őket, 15 00:00:39,860 --> 00:00:46,950 használhatjuk a LINER betűszót: L-I-N-E-R. 16 00:00:46,950 --> 00:00:48,471 Ha esetleg nem volna egyértelmű, 17 00:00:48,471 --> 00:00:50,500 ez majdnem ugyanaz, mint a „lineáris”. 18 00:00:50,500 --> 00:00:53,040 LINER, ami egy „A” betűvel kiegészítve „lineáris” lenne. 19 00:00:53,040 --> 00:00:57,100 Ez nagyon hasznos, hiszen lineáris regresszióról van szó. 20 00:00:57,100 --> 00:01:01,240 Szóval ez az L „lineárisat” jelent. 21 00:01:01,240 --> 00:01:05,000 A feltétel tehát az, hogy a kapcsolat 22 00:01:05,000 --> 00:01:08,530 a populáció x és y változói között 23 00:01:08,530 --> 00:01:11,290 valóban lineáris kapcsolat legyen. 24 00:01:11,290 --> 00:01:20,220 Tehát a kapcsolat valóban lineáris legyen 25 00:01:20,220 --> 00:01:25,910 az x és y között. 26 00:01:25,910 --> 00:01:30,132 Sokszor eleve így feltételezzük, 27 00:01:30,132 --> 00:01:33,647 például egy vizsgán, mondjuk egy felvételin. 28 00:01:33,647 --> 00:01:36,120 Ilyenkor úgy vesszük, hogy ez a feltétel teljesül, 29 00:01:36,120 --> 00:01:38,502 vagy akár úgy, hogy mindegyik teljesül. 30 00:01:38,502 --> 00:01:41,100 A lényeg az, hogy tudd, mik ezek a feltételek. 31 00:01:41,100 --> 00:01:42,810 De érdemes megemlíteni, 32 00:01:42,810 --> 00:01:45,660 hogy ha a mögöttes kapcsolat nem lineáris, 33 00:01:45,660 --> 00:01:47,987 akkor előfordulhat, hogy néhány következtetés 34 00:01:47,987 --> 00:01:50,150 nem lesz annyira megbízható. 35 00:01:50,150 --> 00:01:53,200 A következő, amit már korábban is láttunk, 36 00:01:53,200 --> 00:01:55,740 a következtetések általános feltételeinek kapcsán, 37 00:01:55,740 --> 00:02:00,091 a függetlenségi feltétel (angolul independence). 38 00:02:00,091 --> 00:02:01,980 Ez többféleképpen értelmezhető. 39 00:02:01,980 --> 00:02:05,830 Vagy az egyes megfigyelések függetlenek egymástól, 40 00:02:05,830 --> 00:02:09,180 például a visszatevéses mintavételnél, 41 00:02:09,180 --> 00:02:11,910 vagy gondolhatunk a 10%-os szabályra, 42 00:02:11,910 --> 00:02:13,430 amiről akkor beszéltünk, 43 00:02:13,430 --> 00:02:18,200 amikor az átlagok és arányok függetlenségi feltételét vizsgáltuk. 44 00:02:18,200 --> 00:02:20,010 Itt biztosnak kell lennünk abban, 45 00:02:20,010 --> 00:02:26,020 hogy a mintanagyság legfeljebb 10%-a az alapsokaságnak. 46 00:02:26,020 --> 00:02:28,700 A következő feltétel a normalitás vagy normális eloszlás, 47 00:02:28,700 --> 00:02:29,790 amiről már beszéltünk 48 00:02:29,790 --> 00:02:32,610 az átlagokra és arányokra vonatkozó következtetések kapcsán, 49 00:02:32,610 --> 00:02:35,170 bár amikor regresszióról beszélünk, 50 00:02:35,170 --> 00:02:37,580 egy kicsit összetettebb ez a feltétel. 51 00:02:37,580 --> 00:02:39,590 A normalitást is gyakran úgy vesszük, 52 00:02:39,590 --> 00:02:42,160 hogy teljesül. 53 00:02:42,160 --> 00:02:44,070 Rajzoljunk is egy regressziós egyenest, 54 00:02:44,070 --> 00:02:45,190 három dimenzióban, 55 00:02:45,190 --> 00:02:46,670 hogy perspektívába helyezzük. 56 00:02:46,670 --> 00:02:48,410 Ez az x tengely, 57 00:02:48,410 --> 00:02:50,500 ez az y tengely, 58 00:02:50,500 --> 00:02:54,810 az alapsokaság regressziós egyenese pedig így néz ki. 59 00:02:54,810 --> 00:02:57,270 A normalitási feltétel azt jelenti, 60 00:02:57,270 --> 00:03:00,870 hogy az alapsokaságban bármely x érték esetén 61 00:03:00,870 --> 00:03:06,603 normális eloszlású y értékekre számítunk. 62 00:03:06,603 --> 00:03:11,870 Tehát berajzolom az y értékek normális eloszlását adott x érték esetében. 63 00:03:11,870 --> 00:03:13,990 Íme a normális eloszlás. 64 00:03:13,990 --> 00:03:24,530 Egy másik x érték esetén is normális eloszlásra számítunk. 65 00:03:24,530 --> 00:03:27,760 Tehát adott x érték esetén az y értékek eloszlása normális. 66 00:03:27,760 --> 00:03:28,810 Ahogy már említettem, 67 00:03:28,810 --> 00:03:31,500 sokszor csak feltételezzük, hogy ez teljesül, 68 00:03:31,500 --> 00:03:34,390 mert - legalábbis egy bevezető statisztika órán - 69 00:03:34,390 --> 00:03:36,970 nehéz lenne minderre magadtól rájönni. 70 00:03:36,970 --> 00:03:38,810 A következő feltétel kapcsolódik ehhez, 71 00:03:38,810 --> 00:03:42,640 ez pedig az egyenlő variancia 72 00:03:42,640 --> 00:03:45,090 vagy egyenlő szórásnégyzet. 73 00:03:45,090 --> 00:03:46,390 Ez csak annyit jelent, 74 00:03:46,390 --> 00:03:49,700 hogy ezeknek a normális eloszlásoknak a kiterjedése azonos 75 00:03:49,700 --> 00:03:51,250 az egyes x értékek esetében. 76 00:03:51,250 --> 00:03:53,640 Ezt nevezhetjük egyenlő varianciának 77 00:03:53,640 --> 00:03:56,360 vagy egyenlő szórásnak is. 78 00:03:56,360 --> 00:03:59,880 Tehát, például, ha egy adott x érték mellett 79 00:03:59,880 --> 00:04:02,580 hirtelen sokkal alacsonyabb lenne a variancia, 80 00:04:02,580 --> 00:04:03,620 az így nézne ki, 81 00:04:03,620 --> 00:04:06,890 és így már nem teljesülne a következtetésnek ez a feltétele. 82 00:04:06,890 --> 00:04:10,430 Végül, de nem utolsó sorban, és ezt már sokszor láttuk: 83 00:04:10,430 --> 00:04:12,530 a randomitás vagy véletlenszerűség feltétele. 84 00:04:12,530 --> 00:04:13,870 Ez azt jelenti, hogy az adat 85 00:04:13,870 --> 00:04:17,170 egy megfelelően kivitelezett random mintavételből származik 86 00:04:17,170 --> 00:04:19,200 vagy valamilyen randomizált vizsgálatból. 87 00:04:19,200 --> 00:04:23,040 Ezt a feltételt mindenhol láttuk korábban, 88 00:04:23,040 --> 00:04:25,760 amikor a következtetés feltételeit tárgyaltuk. 89 00:04:25,760 --> 00:04:27,140 Szóval, erről ennyit, 90 00:04:27,140 --> 00:04:28,270 ezeket jó tudni. 91 00:04:28,270 --> 00:04:30,470 Elő fog fordulni néhány vizsgán, 92 00:04:30,470 --> 00:04:34,780 de általában, amikor feladatot oldunk meg egy statisztika alapjai órán, 93 00:04:34,780 --> 00:04:38,720 úgy vesszük, hogy a következtetés feltételei teljesülnek. 94 00:04:38,720 --> 00:04:40,910 Rákérdezhetnek a következtetés feltételeire, 95 00:04:40,910 --> 00:04:43,110 de nem fogják kérni, hogy bizonyítsd be 96 00:04:43,110 --> 00:04:46,010 például a normalitás vagy az egyenlő variancia feltételét. 97 00:04:46,010 --> 00:04:50,086 Az azért túlzás lenne egy statisztika alapjai órán.