WEBVTT 00:00:00.180 --> 00:00:01.940 В предишно видео започнахме да мислим 00:00:01.940 --> 00:00:04.720 как можем да използваме една регресионна права и, в частност, 00:00:04.720 --> 00:00:08.090 ъгловия коефициент (наклона) на една регресионна права, въз основа на данни от извадка, 00:00:08.090 --> 00:00:10.910 как можем да използваме това, за да направим извод 00:00:10.910 --> 00:00:15.700 за ъгловия коефициент на регресионната права на реалната генерална съвкупност. 00:00:15.700 --> 00:00:17.960 В това видео ще помислим 00:00:17.960 --> 00:00:20.260 какви са условията за извод, 00:00:20.260 --> 00:00:22.610 когато си имаме работа с регресионни прави? 00:00:22.610 --> 00:00:24.900 И те по някои начини 00:00:24.900 --> 00:00:27.280 ще са подобни на условията за извод, 00:00:27.280 --> 00:00:30.320 за които се сетихме, когато правехме тестване на хипотеза 00:00:30.320 --> 00:00:33.920 и доверителни интервали за средни стойности и дял/част/процент, 00:00:33.920 --> 00:00:36.890 но ще има няколко нови условия. 00:00:36.890 --> 00:00:39.860 За да запомним тези условия, 00:00:39.860 --> 00:00:46.840 може да искаш да помислиш за акронима LINER. 00:00:46.940 --> 00:00:50.500 Ако не го забелязваш, това е почти като linear (линейно). 00:00:50.500 --> 00:00:53.040 LINER, ако имаше а, щеше да е linear (линейно). 00:00:53.040 --> 00:00:54.670 Това е полезно, понеже, помни, 00:00:54.670 --> 00:00:57.140 мислим за линейна регресия. 00:00:57.140 --> 00:01:01.240 L тук означава linear (линейно). 00:01:01.240 --> 00:01:05.960 И тук условието е реалната зависимост в генералната съвкупност 00:01:05.960 --> 00:01:08.620 между променливите х и у 00:01:08.620 --> 00:01:11.290 да е линейна зависимост – 00:01:11.290 --> 00:01:19.680 реална линейна зависимост 00:01:20.220 --> 00:01:25.700 между х и у. 00:01:25.900 --> 00:01:29.900 В много случаи може просто да трябва да приемеш, че е така, 00:01:29.900 --> 00:01:33.940 когато го видиш на изпит, например на изпит за напреднали. 00:01:33.940 --> 00:01:36.400 Може да ти кажат да приемеш, че условието е изпълнено. 00:01:36.400 --> 00:01:38.560 Често ще ти казват да приемеш, че всички тези условия са изпълнени. 00:01:38.600 --> 00:01:41.100 Те просто искат да знаеш за тези условия. 00:01:41.100 --> 00:01:42.810 Но това е нещо, за което да помислиш. 00:01:42.810 --> 00:01:45.660 Ако зависимостта е нелинейна, 00:01:45.660 --> 00:01:50.080 тогава може би някои от твоите изводи може да не са толкова добри. 00:01:50.140 --> 00:01:53.280 Следващото условие сме виждали преди, 00:01:53.290 --> 00:01:55.560 когато говорихме за общите условия за извод 00:01:55.560 --> 00:02:00.000 и това е условието за независимост (independance). 00:02:00.000 --> 00:02:01.980 И има два начина да помислим за това. 00:02:01.980 --> 00:02:05.800 Или отделните наблюдения са независими едно от друго. 00:02:05.820 --> 00:02:09.180 Тоест може да правиш извадка със заместване. 00:02:09.180 --> 00:02:11.910 Или може да мислиш за 10%-ното правило, 00:02:11.910 --> 00:02:13.430 както сме правили, когато обмисляхме 00:02:13.430 --> 00:02:18.200 условието за независимост за части и средни стойности, 00:02:18.200 --> 00:02:20.010 при които трябва да сме уверени, 00:02:20.010 --> 00:02:26.060 че размерът на извадката е не повече от 10% от размера на генералната съвкупност. 00:02:26.060 --> 00:02:28.140 Следващото е условието за нормалност (normal condition), 00:02:28.140 --> 00:02:29.740 за което сме говорили, 00:02:29.740 --> 00:02:32.600 когато правехме изводи за части и средни стойности. 00:02:32.610 --> 00:02:35.170 Това означава нещо по-сложно, 00:02:35.170 --> 00:02:37.580 когато си имаме работа с регресия. 00:02:37.580 --> 00:02:39.590 Условието за нормалност – и, отново, 00:02:39.590 --> 00:02:42.160 много пъти хората просто ще приемат, че е било изпълнено. 00:02:42.160 --> 00:02:43.820 Но нека начертая една регресионна права, 00:02:43.820 --> 00:02:44.880 но с малко перспектива 00:02:44.880 --> 00:02:46.670 и ще добавя трето измерение. 00:02:46.670 --> 00:02:48.410 Нека кажем, че това е оста х 00:02:48.410 --> 00:02:50.500 и да кажем, че това е оста у. 00:02:50.500 --> 00:02:54.810 И регресионната права на реалната генерална съвкупност изглежда така. 00:02:54.810 --> 00:02:57.270 Условието за нормалност ни казва, 00:02:57.270 --> 00:03:00.840 че за всяко дадено х в реалната генерална съвкупност 00:03:00.860 --> 00:03:06.560 разпределението на всички у е нормално. 00:03:06.600 --> 00:03:11.860 Да видя дали мога да начертая нормално разпределение за всички у при това х. 00:03:11.860 --> 00:03:13.980 Това тук ще е нормално разпределение. 00:03:13.990 --> 00:03:16.860 И, после, да кажем за това х тук, 00:03:16.860 --> 00:03:21.300 също ще очакваш нормално разпределение, 00:03:21.900 --> 00:03:24.520 точно като това. 00:03:24.530 --> 00:03:25.380 Ако ни дават х, 00:03:25.380 --> 00:03:27.760 разпределението на всички у трябва да е нормално. 00:03:27.760 --> 00:03:29.750 Отново, много пъти просто ще ти кажат 00:03:29.750 --> 00:03:32.470 да приемеш, че това условие е било изпълнено, защото, 00:03:32.470 --> 00:03:34.390 поне във въвеждащия клас по статистика, 00:03:34.390 --> 00:03:36.970 може да е малко трудно да разбереш това самостоятелно. 00:03:36.970 --> 00:03:38.810 Следващото условие е свързано с това 00:03:38.810 --> 00:03:42.790 и то е идеята за равна дисперсия (equal variance), 00:03:42.790 --> 00:03:45.090 равна дисперсия. 00:03:45.090 --> 00:03:48.100 И това просто казва, че всяко от тези нормални разпределения 00:03:48.100 --> 00:03:51.240 трябва да има същото разсейване за дадено х. 00:03:51.250 --> 00:03:52.870 Можеш да кажеш равна дисперсия 00:03:52.870 --> 00:03:56.340 или може дори да помислиш за това като за равно стандартно отклонение. 00:03:56.360 --> 00:03:59.880 Например ако, за дадено х, да кажем за това х, 00:03:59.880 --> 00:04:02.580 имаш много по-ниска дисперсия – 00:04:02.580 --> 00:04:03.620 направих го ето така – 00:04:03.620 --> 00:04:06.890 тогава вече няма да изпълняваш условията за извод. 00:04:06.890 --> 00:04:10.430 Последно, но не и по-важност, и това сме виждали много пъти, 00:04:10.430 --> 00:04:12.300 е условието за случайност (random condition). 00:04:12.300 --> 00:04:17.100 И това значи данните да идват от добре създадена случайна извадка 00:04:17.160 --> 00:04:19.200 или от някакъв вид експеримент на случаен принцип. 00:04:19.200 --> 00:04:23.880 Това условие сме виждали във всеки вид условие за извод, 00:04:23.880 --> 00:04:25.760 което сме разгледали дотук. 00:04:25.760 --> 00:04:27.140 И ще приключим тук. 00:04:27.140 --> 00:04:28.270 Добре е да знаеш тези неща. 00:04:28.270 --> 00:04:30.470 Може да ги има на някои изпити. 00:04:30.470 --> 00:04:35.200 Но много пъти, когато дойде ред за решаване на задачи във въвеждащ курс по статистика, 00:04:35.200 --> 00:04:38.720 те ще ти кажат да приемеш, че условията за извод са били изпълнени. 00:04:38.720 --> 00:04:40.910 Или "какви са условията за извод?" 00:04:40.910 --> 00:04:42.970 Но всъщност няма да те накарат да докажеш, например, 00:04:42.970 --> 00:04:46.010 условието за нормалност или за равна дисперсия. 00:04:46.010 --> 00:04:47.040 Това ще е прекалено сложно 00:04:47.040 --> 00:04:49.763 за въвеждащ клас по статистика.