1 00:00:00,180 --> 00:00:01,940 В предишно видео започнахме да мислим 2 00:00:01,940 --> 00:00:04,720 как можем да използваме една регресионна права и, в частност, 3 00:00:04,720 --> 00:00:08,090 ъгловия коефициент (наклона) на една регресионна права, въз основа на данни от извадка, 4 00:00:08,090 --> 00:00:10,910 как можем да използваме това, за да направим извод 5 00:00:10,910 --> 00:00:15,700 за ъгловия коефициент на регресионната права на реалната генерална съвкупност. 6 00:00:15,700 --> 00:00:17,960 В това видео ще помислим 7 00:00:17,960 --> 00:00:20,260 какви са условията за извод, 8 00:00:20,260 --> 00:00:22,610 когато си имаме работа с регресионни прави? 9 00:00:22,610 --> 00:00:24,900 И те по някои начини 10 00:00:24,900 --> 00:00:27,280 ще са подобни на условията за извод, 11 00:00:27,280 --> 00:00:30,320 за които се сетихме, когато правехме тестване на хипотеза 12 00:00:30,320 --> 00:00:33,920 и доверителни интервали за средни стойности и дял/част/процент, 13 00:00:33,920 --> 00:00:36,890 но ще има няколко нови условия. 14 00:00:36,890 --> 00:00:39,860 За да запомним тези условия, 15 00:00:39,860 --> 00:00:46,840 може да искаш да помислиш за акронима LINER. 16 00:00:46,940 --> 00:00:50,500 Ако не го забелязваш, това е почти като linear (линейно). 17 00:00:50,500 --> 00:00:53,040 LINER, ако имаше а, щеше да е linear (линейно). 18 00:00:53,040 --> 00:00:54,670 Това е полезно, понеже, помни, 19 00:00:54,670 --> 00:00:57,140 мислим за линейна регресия. 20 00:00:57,140 --> 00:01:01,240 L тук означава linear (линейно). 21 00:01:01,240 --> 00:01:05,960 И тук условието е реалната зависимост в генералната съвкупност 22 00:01:05,960 --> 00:01:08,620 между променливите х и у 23 00:01:08,620 --> 00:01:11,290 да е линейна зависимост – 24 00:01:11,290 --> 00:01:19,680 реална линейна зависимост 25 00:01:20,220 --> 00:01:25,700 между х и у. 26 00:01:25,900 --> 00:01:29,900 В много случаи може просто да трябва да приемеш, че е така, 27 00:01:29,900 --> 00:01:33,940 когато го видиш на изпит, например на изпит за напреднали. 28 00:01:33,940 --> 00:01:36,400 Може да ти кажат да приемеш, че условието е изпълнено. 29 00:01:36,400 --> 00:01:38,560 Често ще ти казват да приемеш, че всички тези условия са изпълнени. 30 00:01:38,600 --> 00:01:41,100 Те просто искат да знаеш за тези условия. 31 00:01:41,100 --> 00:01:42,810 Но това е нещо, за което да помислиш. 32 00:01:42,810 --> 00:01:45,660 Ако зависимостта е нелинейна, 33 00:01:45,660 --> 00:01:50,080 тогава може би някои от твоите изводи може да не са толкова добри. 34 00:01:50,140 --> 00:01:53,280 Следващото условие сме виждали преди, 35 00:01:53,290 --> 00:01:55,560 когато говорихме за общите условия за извод 36 00:01:55,560 --> 00:02:00,000 и това е условието за независимост (independance). 37 00:02:00,000 --> 00:02:01,980 И има два начина да помислим за това. 38 00:02:01,980 --> 00:02:05,800 Или отделните наблюдения са независими едно от друго. 39 00:02:05,820 --> 00:02:09,180 Тоест може да правиш извадка със заместване. 40 00:02:09,180 --> 00:02:11,910 Или може да мислиш за 10%-ното правило, 41 00:02:11,910 --> 00:02:13,430 както сме правили, когато обмисляхме 42 00:02:13,430 --> 00:02:18,200 условието за независимост за части и средни стойности, 43 00:02:18,200 --> 00:02:20,010 при които трябва да сме уверени, 44 00:02:20,010 --> 00:02:26,060 че размерът на извадката е не повече от 10% от размера на генералната съвкупност. 45 00:02:26,060 --> 00:02:28,140 Следващото е условието за нормалност (normal condition), 46 00:02:28,140 --> 00:02:29,740 за което сме говорили, 47 00:02:29,740 --> 00:02:32,600 когато правехме изводи за части и средни стойности. 48 00:02:32,610 --> 00:02:35,170 Това означава нещо по-сложно, 49 00:02:35,170 --> 00:02:37,580 когато си имаме работа с регресия. 50 00:02:37,580 --> 00:02:39,590 Условието за нормалност – и, отново, 51 00:02:39,590 --> 00:02:42,160 много пъти хората просто ще приемат, че е било изпълнено. 52 00:02:42,160 --> 00:02:43,820 Но нека начертая една регресионна права, 53 00:02:43,820 --> 00:02:44,880 но с малко перспектива 54 00:02:44,880 --> 00:02:46,670 и ще добавя трето измерение. 55 00:02:46,670 --> 00:02:48,410 Нека кажем, че това е оста х 56 00:02:48,410 --> 00:02:50,500 и да кажем, че това е оста у. 57 00:02:50,500 --> 00:02:54,810 И регресионната права на реалната генерална съвкупност изглежда така. 58 00:02:54,810 --> 00:02:57,270 Условието за нормалност ни казва, 59 00:02:57,270 --> 00:03:00,840 че за всяко дадено х в реалната генерална съвкупност 60 00:03:00,860 --> 00:03:06,560 разпределението на всички у е нормално. 61 00:03:06,600 --> 00:03:11,860 Да видя дали мога да начертая нормално разпределение за всички у при това х. 62 00:03:11,860 --> 00:03:13,980 Това тук ще е нормално разпределение. 63 00:03:13,990 --> 00:03:16,860 И, после, да кажем за това х тук, 64 00:03:16,860 --> 00:03:21,300 също ще очакваш нормално разпределение, 65 00:03:21,900 --> 00:03:24,520 точно като това. 66 00:03:24,530 --> 00:03:25,380 Ако ни дават х, 67 00:03:25,380 --> 00:03:27,760 разпределението на всички у трябва да е нормално. 68 00:03:27,760 --> 00:03:29,750 Отново, много пъти просто ще ти кажат 69 00:03:29,750 --> 00:03:32,470 да приемеш, че това условие е било изпълнено, защото, 70 00:03:32,470 --> 00:03:34,390 поне във въвеждащия клас по статистика, 71 00:03:34,390 --> 00:03:36,970 може да е малко трудно да разбереш това самостоятелно. 72 00:03:36,970 --> 00:03:38,810 Следващото условие е свързано с това 73 00:03:38,810 --> 00:03:42,790 и то е идеята за равна дисперсия (equal variance), 74 00:03:42,790 --> 00:03:45,090 равна дисперсия. 75 00:03:45,090 --> 00:03:48,100 И това просто казва, че всяко от тези нормални разпределения 76 00:03:48,100 --> 00:03:51,240 трябва да има същото разсейване за дадено х. 77 00:03:51,250 --> 00:03:52,870 Можеш да кажеш равна дисперсия 78 00:03:52,870 --> 00:03:56,340 или може дори да помислиш за това като за равно стандартно отклонение. 79 00:03:56,360 --> 00:03:59,880 Например ако, за дадено х, да кажем за това х, 80 00:03:59,880 --> 00:04:02,580 имаш много по-ниска дисперсия – 81 00:04:02,580 --> 00:04:03,620 направих го ето така – 82 00:04:03,620 --> 00:04:06,890 тогава вече няма да изпълняваш условията за извод. 83 00:04:06,890 --> 00:04:10,430 Последно, но не и по-важност, и това сме виждали много пъти, 84 00:04:10,430 --> 00:04:12,300 е условието за случайност (random condition). 85 00:04:12,300 --> 00:04:17,100 И това значи данните да идват от добре създадена случайна извадка 86 00:04:17,160 --> 00:04:19,200 или от някакъв вид експеримент на случаен принцип. 87 00:04:19,200 --> 00:04:23,880 Това условие сме виждали във всеки вид условие за извод, 88 00:04:23,880 --> 00:04:25,760 което сме разгледали дотук. 89 00:04:25,760 --> 00:04:27,140 И ще приключим тук. 90 00:04:27,140 --> 00:04:28,270 Добре е да знаеш тези неща. 91 00:04:28,270 --> 00:04:30,470 Може да ги има на някои изпити. 92 00:04:30,470 --> 00:04:35,200 Но много пъти, когато дойде ред за решаване на задачи във въвеждащ курс по статистика, 93 00:04:35,200 --> 00:04:38,720 те ще ти кажат да приемеш, че условията за извод са били изпълнени. 94 00:04:38,720 --> 00:04:40,910 Или "какви са условията за извод?" 95 00:04:40,910 --> 00:04:42,970 Но всъщност няма да те накарат да докажеш, например, 96 00:04:42,970 --> 00:04:46,010 условието за нормалност или за равна дисперсия. 97 00:04:46,010 --> 00:04:47,040 Това ще е прекалено сложно 98 00:04:47,040 --> 00:04:49,763 за въвеждащ клас по статистика.