-
Нека научим малко за
Закона за големите числа,
-
който на много нива е един
от най-логичните закони
-
в математиката и в
теорията на вероятностите.
-
Но понеже е толкова приложим
в различни области,
-
понякога се прилага погрешно,
като е леко неразбран.
-
За да бъдем малко формални
в нашата математика,
-
нека просто най-напред
да го дефинирам
-
и след това ще говорим
малко за логиката.
-
Та да кажем, че имам
една случайна променлива Х.
-
И знаем нейната очаквана стойност или
средната стойност на генералната съвкупност.
-
Законът за големите числа казва, че
-
ако вземем дадена извадка с n на брой
наблюдения на нашата случайна променлива,
-
и ако намерим средната стойност от
всички тези наблюдения...
-
тук ще дефинирам още една
променлива.
-
Нека я наречем х с индекс n
с черта над нея.
-
Това представлява средната стойност
за n наблюдения
-
на нашата случайна променлива.
-
Така че буквално това е
първото ми наблюдение.
-
И може някак да си представиш,
че веднъж провеждам експеримента,
-
получавам наблюдаваното, и пак го провеждам,
и пак е налице това наблюдение.
-
Продължавам да го провеждам
n на брой пъти,
-
след което разделям
на броя наблюдения.
-
Така че това е моята
извадкова средна стойност.
-
Това е средната стойност на всички
направени от мен наблюдения.
-
Законът на големите числа ни казва, че
моята извадкова средна стойност
-
ще достигне очакваната стойност
на случайната променлива...
-
Или бих могъл да го напиша и така:
извадковата средна стойност ще достигне
-
средната стойност на генералната съвкупност
при n, клонящо към безкрайност.
-
Ще използвам малко по-обикновен език
относно това какво значи
-
клонящ или приближаване.
-
Но мисля, че схващаш логически
това, че ако тук
-
взема достатъчно голяма извадка,
то накрая ще получа
-
очакваната стойност на
генералната съвкупност.
-
И мисля, че за много от нас
това е един вид логично.
-
Че ако направя достатъчно опити
с големи извадки, тези опити
-
биха ми дали числата, които ще покажат
-
очакваната стойност и вероятността
и подобните на тях.
-
Но мисля, че често не се разбира
-
причината,
поради която се случва.
-
Преди да премина по-нататък,
-
ще дам един конкретен пример.
-
Законът за големите числа
ще ни каже, че... да кажем,
-
че имам една случайна променлива –
Х е равно на броя ези-та
-
след 100 подхвърляния на една балансирана
монета - подхвърляния или хвърляния
-
на една симетрична монета.
-
Най-напред, знаем каква е
очакваната стойност
-
на тази случайна променлива.
-
Тя представлява броя подхвърляния,
броя опити, умножен
-
по вероятността за успех при всеки опит.
-
А това е равно на 50.
-
Законът за големите числа гласи,
че ако взема една извадка
-
или ако взема средната стойност от извадката
на всички тези опити,
-
тогава получавам... първият ми път,
в който провеждам този опит
-
аз подхвърлям 100 монети или разполагам
със 100 монети в една кутия за обувки,
-
разтърсвам кутията и преброявам
броя на ези-тата, като получавам 55.
-
Това ще е Х1.
-
След това отново разтърсвам кутията
и получавам 65.
-
Тогава пак разтърсвам кутията
и получавам 45.
-
Така правя това n пъти,
след което го разделям на
-
броя пъти, които съм го направил.
-
Законът за големите числа ни казва, че
тази средна стойност
-
от всички мои наблюдения,
-
ще доближи 50 при n,
клонящо към безкрайност.
-
Или при n, клонящо към 50.
-
Извинявам се, при n,
клонящо към безкрайност.
-
Сега искам да обсъдим
причината това да се случва
-
или да покажа логически
защо е така.
-
Много хора някак си чувстват,
че, това означава, че
-
ако след 100 опита аз съм
над средната стойност, и
-
законите на вероятностите
ще ми осигурят повече ези-та
-
или по-малко ези-та,
за да се компенсира разликата.
-
Това не е точно така.
-
Често го наричаме
заблудата на комарджията.
-
Нека разгранича нещата.
-
И ще използвам този пример.
-
Тук ще начертая една графика.
-
И ще сменя цветовете.
-
Нека това да е...
-
Това е n, моята абсцисна ос е n.
-
Това е броят опити, които правя.
-
На ординатна ос е
извадковата средна стойност.
-
Знаем какво представлява
очакваната стойност, знаем и това,
-
че за тази случайна променлива тя е 50.
-
Ще начертая това тук.
-
Така, 50.
-
Сега се връщаме
на разглеждания пример.
-
Когато n е равно на...
-
При първия си опит получих 55 ези
и това беше моята средна стойност.
-
Имах само една точка за данните.
-
После след два опита,
да видим... тук резултатът е 65.
-
И моята средна стойност ще е равна на
65 плюс 55, делено на 2.
-
Което е 60.
-
Така моята средна стойност
малко се покачва.
-
При следващия опит
имахме 45, което леко ще
-
намали средната стойност.
-
Тук няма да нанасям 45.
-
Сега трябва да намерим
средната стойност на всичко.
-
Колко е 45 плюс 65?
-
Ще сметна числото,
-
за да схванеш основното.
-
Имаме 55 плюс 65.
-
Това е 120 плюс 45,
което дава 165.
-
Делено на 3.
-
3 се съдържа в 165...
5 по 3 е 15.
-
Това е 53.
-
Не, не, не.
-
55.
-
Така че средната стойност
слиза на 55.
-
И можем да продължим
да правим тези опити.
-
Може да кажеш, че законът за
големите числа е причина за това.
-
Значи след 3 опита
нашата средна стойност е това.
-
И много хора мислят, че някак
си властелините на вероятността
-
ще я направят по-голяма,
така че в бъдеще да получим
-
по-малко на брой ези-та.
-
Че някак си следващите два опита
ще трябва да са тук долу,
-
за да може нашата средна стойност
да намалее.
-
Но това не е задължително така.
-
При продължаването нататък
вероятностите си остават същите.
-
Вероятността винаги е 50%
да получим ези.
-
Не е все едно да имам определен брой
езита в началото или
-
ако получа повече на брой езита,
отколкото съм очаквал за началото,
-
и после изведнъж нещата ще се компенсират
и ще получа повече тура.
-
Това представлява
заблудата на комарджията.
-
Ако имаме една голяма
поредица от ези-та
-
или непропорционален брой ези-та,
на определен етап ще получим...
-
има по-голяма вероятност да получим
-
диспропорционален брой тура.
-
А това не е вярно.
-
Основното в закона за големите числа е,
че той не се интересува...
-
Да кажем, че след
определен брой опити
-
средната стойност всъщност...
има малка вероятност това да се случи,
-
но да кажем, че средната стойност е тук горе.
-
Тя всъщност е на 70.
-
Олеле, наистина сме се отклонили от
-
очакваната стойност.
-
Но това, което ни казва
законът за големите числа, е,
-
че не ни интересува
колко опити са направени.
-
Остатъкът от опити, които
имаме е безкраен.
-
А очакваната стойност
при този безкрайно голям брой опити,
-
особено в този вид ситуация,
ще е следната.
-
И когато намираме
средната стойност на крайно число към
-
някакво по-голямо число, а след
това периодична дроб, която
-
ще се приближи към стойността на това,
с течение на времето ще се приближим
-
до очакваната стойност.
-
Този начин на описание
беше малко неформален,
-
но така гласи законът за големите числа.
-
И това е нещо важно.
-
Не е казано, че ако са имаме
няколко ези-та, тогава
-
вероятността да получим
тура някак си ще се
-
увеличи за сметка на ези-тата.
-
Това, което се казва тук, е, че
без значение какво се е случило,
-
за определен брой опити, без значение
каква е средната стойност
-
след този определен брой опити,
останали са
-
ни неопределен брой опити.
-
И ако човек направи достатъчно от тях,
това ще се приближи
-
до нашата очаквана стойност.
-
И това е много важно.
-
Но това не се използва в ежедневната практика
при лотарията и в казината,
-
защото там знаят, че ако човек направи
достатъчно голям брой опити,
-
а можем дори да изчислим
-
дали правим достатъчен брой опити,
-
каква е вероятността тогава
нещата значително да се отклонят?
-
Но казината и лотарията
ежедневно прилагат този принцип ,
-
така че ако вземем
достатъчно хора – естествено
-
в кратък срок – или с няколко опита,
-
двама ще ударят джакпота.
-
Но през повечето от времето
казиното винаги ще печели,
-
поради параметрите на игрите, които
-
то предлага на играчите.
-
Както и да е, това е нещо важно
при вероятностите
-
и мисля, че е сравнително разбираемо.
-
Въпреки че понякога, когато
го виждаме обяснено подробно,
-
като в случая със случайните променливи,
-
а това е малко объркващо.
-
Всичко, което се казва е, че като
правим повече и повече опити,
-
средната стойност на тези извадки
ще приближава
-
истинската средна стойност.
-
Или трябва да съм малко по-конкретен.
-
Средната стойност на извадката
ще се доближи до
-
истинската средна стойност на
генералната съвкупност или
-
до очакваната стойност
на случайната променлива.
-
Както и да е, ще се видим следващия път.