0:00:00.180,0:00:01.940 В предишно видео започнахме да мислим 0:00:01.940,0:00:04.720 как можем да използваме една регресионна права и, в частност, 0:00:04.720,0:00:08.090 ъгловия коефициент (наклона) на една регресионна права, въз основа на данни от извадка, 0:00:08.090,0:00:10.910 как можем да използваме това, за да направим извод 0:00:10.910,0:00:15.700 за ъгловия коефициент на регресионната права[br]на реалната генерална съвкупност. 0:00:15.700,0:00:17.960 В това видео ще помислим 0:00:17.960,0:00:20.260 какви са условията за извод, 0:00:20.260,0:00:22.610 когато си имаме работа с регресионни прави? 0:00:22.610,0:00:24.900 И те по някои начини 0:00:24.900,0:00:27.280 ще са подобни на условията за извод, 0:00:27.280,0:00:30.320 за които се сетихме, когато правехме тестване на хипотеза 0:00:30.320,0:00:33.920 и доверителни интервали за средни стойности и дял/част/процент, 0:00:33.920,0:00:36.890 но ще има няколко нови условия. 0:00:36.890,0:00:39.860 За да запомним тези условия, 0:00:39.860,0:00:46.840 може да искаш да помислиш за акронима LINER. 0:00:46.940,0:00:50.500 Ако не го забелязваш, това е почти като linear (линейно). 0:00:50.500,0:00:53.040 LINER, ако имаше а, щеше да е linear (линейно). 0:00:53.040,0:00:54.670 Това е полезно, понеже, помни, 0:00:54.670,0:00:57.140 мислим за линейна регресия. 0:00:57.140,0:01:01.240 L тук означава linear (линейно). 0:01:01.240,0:01:05.960 И тук условието е реалната зависимост в генералната съвкупност 0:01:05.960,0:01:08.620 между променливите х и у 0:01:08.620,0:01:11.290 да е линейна зависимост – 0:01:11.290,0:01:19.680 реална линейна зависимост 0:01:20.220,0:01:25.700 между х и у. 0:01:25.900,0:01:29.900 В много случаи може просто да трябва да приемеш, че е така, 0:01:29.900,0:01:33.940 когато го видиш на изпит, например на изпит за напреднали. 0:01:33.940,0:01:36.400 Може да ти кажат да приемеш, че условието е изпълнено. 0:01:36.400,0:01:38.560 Често ще ти казват да приемеш, че [br]всички тези условия са изпълнени. 0:01:38.600,0:01:41.100 Те просто искат да знаеш за тези условия. 0:01:41.100,0:01:42.810 Но това е нещо, за което да помислиш. 0:01:42.810,0:01:45.660 Ако зависимостта е нелинейна, 0:01:45.660,0:01:50.080 тогава може би някои от твоите изводи [br]може да не са толкова добри. 0:01:50.140,0:01:53.280 Следващото условие сме виждали преди, 0:01:53.290,0:01:55.560 когато говорихме за общите условия за извод 0:01:55.560,0:02:00.000 и това е условието за независимост (independance). 0:02:00.000,0:02:01.980 И има два начина да помислим за това. 0:02:01.980,0:02:05.800 Или отделните наблюдения са независими едно от друго. 0:02:05.820,0:02:09.180 Тоест може да правиш извадка със заместване. 0:02:09.180,0:02:11.910 Или може да мислиш за 10%-ното правило, 0:02:11.910,0:02:13.430 както сме правили, когато обмисляхме 0:02:13.430,0:02:18.200 условието за независимост за части и средни стойности, 0:02:18.200,0:02:20.010 при които трябва да сме уверени, 0:02:20.010,0:02:26.060 че размерът на извадката е не повече от 10% [br]от размера на генералната съвкупност. 0:02:26.060,0:02:28.140 Следващото е условието за нормалност [br](normal condition), 0:02:28.140,0:02:29.740 за което сме говорили, 0:02:29.740,0:02:32.600 когато правехме изводи за части и средни стойности. 0:02:32.610,0:02:35.170 Това означава нещо по-сложно, 0:02:35.170,0:02:37.580 когато си имаме работа с регресия. 0:02:37.580,0:02:39.590 Условието за нормалност – и, отново, 0:02:39.590,0:02:42.160 много пъти хората просто ще приемат, че е било изпълнено. 0:02:42.160,0:02:43.820 Но нека начертая една регресионна права, 0:02:43.820,0:02:44.880 но с малко перспектива 0:02:44.880,0:02:46.670 и ще добавя трето измерение. 0:02:46.670,0:02:48.410 Нека кажем, че това е оста х 0:02:48.410,0:02:50.500 и да кажем, че това е оста у. 0:02:50.500,0:02:54.810 И регресионната права на реалната генерална съвкупност изглежда така. 0:02:54.810,0:02:57.270 Условието за нормалност ни казва, 0:02:57.270,0:03:00.840 че за всяко дадено х в реалната генерална съвкупност 0:03:00.860,0:03:06.560 разпределението на всички у е нормално. 0:03:06.600,0:03:11.860 Да видя дали мога да начертая [br]нормално разпределение за всички у при това х. 0:03:11.860,0:03:13.980 Това тук ще е нормално разпределение. 0:03:13.990,0:03:16.860 И, после, да кажем за това х тук, 0:03:16.860,0:03:21.300 също ще очакваш нормално разпределение, 0:03:21.900,0:03:24.520 точно като това. 0:03:24.530,0:03:25.380 Ако ни дават х, 0:03:25.380,0:03:27.760 разпределението на всички у трябва да е нормално. 0:03:27.760,0:03:29.750 Отново, много пъти просто ще ти кажат 0:03:29.750,0:03:32.470 да приемеш, че това условие е било изпълнено, защото, 0:03:32.470,0:03:34.390 поне във въвеждащия клас по статистика, 0:03:34.390,0:03:36.970 може да е малко трудно да разбереш това самостоятелно. 0:03:36.970,0:03:38.810 Следващото условие е свързано с това 0:03:38.810,0:03:42.790 и то е идеята за равна дисперсия (equal variance), 0:03:42.790,0:03:45.090 равна дисперсия. 0:03:45.090,0:03:48.100 И това просто казва, че всяко от тези нормални разпределения 0:03:48.100,0:03:51.240 трябва да има същото разсейване за дадено х. 0:03:51.250,0:03:52.870 Можеш да кажеш равна дисперсия 0:03:52.870,0:03:56.340 или може дори да помислиш за това като за равно стандартно отклонение. 0:03:56.360,0:03:59.880 Например ако, за дадено х, да кажем за това х, 0:03:59.880,0:04:02.580 имаш много по-ниска дисперсия – 0:04:02.580,0:04:03.620 направих го ето така – 0:04:03.620,0:04:06.890 тогава вече няма да изпълняваш условията за извод. 0:04:06.890,0:04:10.430 Последно, но не и по-важност, и това сме виждали много пъти, 0:04:10.430,0:04:12.300 е условието за случайност (random condition). 0:04:12.300,0:04:17.100 И това значи данните да идват от [br]добре създадена случайна извадка 0:04:17.160,0:04:19.200 или от някакъв вид експеримент на случаен принцип. 0:04:19.200,0:04:23.880 Това условие сме виждали във всеки вид условие за извод, 0:04:23.880,0:04:25.760 което сме разгледали дотук. 0:04:25.760,0:04:27.140 И ще приключим тук. 0:04:27.140,0:04:28.270 Добре е да знаеш тези неща. 0:04:28.270,0:04:30.470 Може да ги има на някои изпити. 0:04:30.470,0:04:35.200 Но много пъти, когато дойде ред за решаване [br]на задачи във въвеждащ курс по статистика, 0:04:35.200,0:04:38.720 те ще ти кажат да приемеш, че [br]условията за извод са били изпълнени. 0:04:38.720,0:04:40.910 Или "какви са условията за извод?" 0:04:40.910,0:04:42.970 Но всъщност няма да те накарат да докажеш, например, 0:04:42.970,0:04:46.010 условието за нормалност или за равна дисперсия. 0:04:46.010,0:04:47.040 Това ще е прекалено сложно 0:04:47.040,0:04:49.763 за въвеждащ клас по статистика.