-
Добро пожаловать в плейлист по статистике,
-
- это то, чем я хотел бы заняться на некоторое время.
-
Итак, я хочу приступить прямо к сути и
-
я постараюсь предоставить как можно больше примеров, чтобы
-
дать вам почувствовать, что представляет собой статистика.
-
И, просто чтобы начать с чего-либо, в случае если Вы не
-
знакомы с этим (хотя, я думаю, много людей интуитивно
-
понимают, что такое статистика).
-
По сути, пусть и в общих чертах, это своего рода
-
погружение в мир данных.
-
И оно может быть классифицировано.
-
Ну, может быть три категории.
-
Итак, у нас есть описательная статистика.
-
Так сказать, у вас есть много данных, и вы хотите кому-нибудь сообщить
-
о них, не передавая при этом сами данные.
-
Возможно, вы можете найти некие показательные числа,
-
которые каким-то образом представляют данные целиком
-
, без необходимости перечисления.
-
Это были бы описательные статистики (функции данных).
-
Существует также предсказывающая статистика.
-
Ну, ладно, я их сгруппирую их вместе.
-
Есть теория оценивания.
-
То есть, когда данные используются, по сути,
-
для того, чтобы делать выводы.
-
Итак, скажем, вы произвели выборку данных (из генеральной совокупности) -
-
в дальнейшем мы будем много говорить о выборках в сравнении с генеракльной совокупностью -
-
но я думаю, интуитивно вы понимаете, что это, не так ли?
-
Если я опрашиваю трёх человек, которые собираются голосовать за
-
президента, я явно не опрашивал всё население.
-
Я опросил выборку.
-
Но вся суть Теории Оценивания, - это, как если бы мы могли
-
с помощью неких математические действия на выборках, делать выводы или
-
заключения в отношении генеральной совокупности в целом.
-
Ну во всяком случае, это просто большая картина того, что
-
собой представляет Статистика.
-
Давайте просто перейдём к её сути и начнём
-
с описательной статистики.
-
Так что первое, что - я не знаю, - что я хотел бы
-
делать - или даже большинство людей хотели бы делать, - когда им
-
даётся весь набор чисел и их просят описать его.
-
Ну, возможно, я могу предоставить некоторое число, наиболее
-
показательное из всех чисел в этом наборе.
-
Или некоторое число, представляющее, в некотором роде, центральную тенденцию
-
- вы встретите это словосочетание много раз в книгах статистике.
-
Центральная тенденция набора чисел.
-
И это также называется среднее.
-
И я буду здесь немного аккуратнее, чем обычно,
-
с словом «среднее». Когда я говорю об нём в этом контексте,
-
Это просто означает, что среднее это число, которое каким-то образом
-
даёт нам ощущение центральной тенденции.
-
Или может быть число, которое является наиболее представительным во множестве.
-
И я знаю, что это звучит всё очень абстрактно, но давайте
-
сделаем пару примеров.
-
Так что есть куча способов, которыми вы можете на самом деле измерить
-
центральную тенденцию или среднее значение набора чисел.
-
И вы, наверное, видели их раньше.
-
Это - среднее.
-
И на самом деле, есть различные виды средних, но мы будем придерживаться
-
среднего арифметического,
-
геометрического и, возможно, мы охватим и гармоческое
-
однажды.
-
Есть среднее, медиана и мода.
-
И в статистике говорят, все они могут являться
-
чем-то вроде представителей наборов данных или центральной тенденцией генеральной совокупности
-
или центральной тенденцией выборки.
-
И все они вместе - все они могут быть
-
формой в среднего.
-
И я думаю, - когда мы увидим примеры, - во всём это будет
-
чуть больше смысла.
-
В повседневной речи, когда люди говорят о среднем, - я думаю
-
вы уже рассчитывали средние в вашей жизни, - они
-
обычно говорят о среднем арифметическом.
-
Поэтому обычно когда кто-то говорит, «возьмем среднее
-
этих чисел», они ожидают от вас, чтобы
-
вы вычислили среднее арифметическое.
-
Они не хотят, чтобы вы вычисляли медиану или моду.
-
Но прежде, чем идти дальше, давайте поймём, что
-
это такое.
-
Позвольте мне представить ряд чисел.
-
Скажем, у меня есть число 1.
-
Скажем, у меня есть еще 1, 2, 3.
-
Скажем, у меня есть 4.
-
Это достаточно хорошо.
-
Мы просто хотим простой пример.
-
Таким образом среднее или среднее арифметическое, - то, с чем вы, вероятно,
-
наиболее знакомы, когда люди говорят о среднем.
-
И это по сути - вы складываете все числа и вы
-
делите на количество чисел.
-
Поэтому в данном случае было бы 1 плюс 1 плюс 2 плюс 3 и 4.
-
И вы собираетесь делить один, два, три,
-
четыре, пять чисел.
-
Чему это равно?
-
1 плюс 1 равняется 2.
-
2 плюс 2 равняется 4.
-
4 плюс 3 равняется 7.
-
7 плюс 4 равняется 11.
-
Так что это равно 11/5.
-
Чему это равняется?
-
Это 2 1/5?
-
Итак, это равно 2,2.
-
И так кто-то может сказать, Эй, вы знаете.
-
Это довольно хороший представитель
-
количество этого набора.
-
Это число, что все эти номера вы можете рода
-
говорят ближе к.» Или 2.2 представляет центральный
-
тенденция этого набора.
-
И в общем говорить, что бы в среднем.
-
Но если мы чуть-чуть более конкретной, это
-
Это среднее арифметическое этого набора чисел.
-
И вы увидите, что это своего рода.
-
Если я не хочу дать вам список из пяти чисел, я
-
можно сказать, "Ну, вы знаете, у меня есть набор из пяти чисел и
-
их среднее — 2.2.» Это своего рода говорит вам немного на
-
крайней мере вы знаете, где цифры.
-
Мы будем говорить немного больше о как вы знаете, как далеко
-
числа являются от означает вероятно на следующий видео.
-
Так что это одна из мер.
-
Еще одной мерой, вместо среднем таким образом, вам
-
можно средняя, поставив числа в порядке, который
-
Я на самом деле уже сделал.
-
Так что давайте просто записать их в порядке снова.
-
1, 1, 2, 3, 4.
-
И вы просто взять среднего числа.
-
Итак, давайте посмотрим, есть один, два, три, четыре, пять номеров.
-
Так среднего числа собирается быть здесь, право?
-
Средний номер — 2.
-
Существует два числа, больше чем 2 и есть два
-
номера меньше, чем 2.
-
И это называется медиана.
-
Так что это на самом деле очень мало вычислений.
-
Вы просто должны по существу сортировки чисел.
-
И тогда вы найдете любой номер, где у вас есть
-
равное число больше или меньше, чем это число.
-
Поэтому средний этот набор является 2.
-
И вы видите, я имею в виду, что это на самом деле довольно
-
близко к среднему.
-
И не правильный ответ.
-
Один из них не лучше ответ для среднего.
-
Они просто разные способы измерения в среднем.
-
Так вот средний.
-
И я знаю, что вы могли бы думать. «Ну, что было
-
легко достаточно, когда мы имели пять номеров.
-
Что делать, если мы имели шесть чисел?»
Что делать, если это было так?
-
Что делать, если это был наш набор чисел?
-
1, 1, 2, 3, добавим еще 4.
-
Так что теперь существует нет среднего числа, право?
-
Я имею в виду 2 не является средним числом, потому что есть два меньше
-
чем и три больше, чем он.
-
И затем 3 не среднего числа потому что есть три
-
более крупные и--жаль, есть два больших и три
-
меньше, чем это.
-
Так что это не среднего числа.
-
Так что если у вас есть набор с четными номерами и кто-то говорит
-
вам выяснить, медиана, что вы делаете это, вы берете
-
Ближний два числа и затем вы берете арифметическое
-
из этих двух чисел.
-
Так что в этом случае этого набора, медиана бы 2.5.
-
Ярмарка достаточно.
-
Но давайте отложить это потому что я хочу сравнить
-
Медиана и средства и режимы для того же
-
набор чисел.
-
Но это хорошая вещь, чтобы знать, потому что иногда он
-
может быть немного запутанным.
-
И это все определения.
-
Это все виды математических инструментов для получения
-
наши головы вокруг чисел.
-
Это не как один прекрасный день кто-то видел один из этих формул на
-
лицо солнца и говорит, «Oh, которая является частью
-
Вселенная, что это, как рассчитывается средняя.»
-
Это человеческой конструкции просто получить наши головы
-
вокруг больших наборов данных.
-
Это не большой набор данных, но вместо пяти чисел, если
-
у нас было пять миллионов номеров, вы можете себе представить, если вы не
-
как думать о каждый номер индивидуально.
-
Во всяком случае прежде чем говорить об этом, позвольте мне сказать
-
Вы является то, что режим.
-
И режим в некоторой степени, это один, я думаю, что большинство
-
люди вероятно забыть или никогда не узнать, и когда они видят его на
-
экзамен, он путает их, потому что они, как «Oh, что
-
звуки очень расширенный.» Но в некотором смысле, это самый простой
-
все меры из центральной тенденции или среднего.
-
Режим является по существу, какое число является наиболее распространенным в наборе.
-
Так что в этом примере существует два 1 и затем есть одна
-
все остальное, правда?
-
Поэтому здесь режим 1.
-
Поэтому режим является наиболее общий номер.
-
И тогда вы рода можно сказать, «вау, Эй Сал, что
-
Если бы это был наш набор?
-
1, 1, 2, 3, 4, 4.» Здесь у меня есть два 1 и у меня есть два 4.
-
И это, где режим становится немного сложнее потому, что
-
любой из них будет иметь достойного ответа для режима.
-
Вы могли действительно сказал это способ 1 или
-
режим этого 4 и он получает немного неоднозначным.
-
И вы, вероятно, хотят немного ясности от
-
лица, просим вас.
-
Большинство раз на тест когда они спрашивают вас, там не будет
-
чтобы быть этой двусмысленности.
-
Там будет ряд наиболее распространенных в наборе.
-
Так что теперь это как Ох, ну вы знаете, почему не только один
-
из этих достаточно?
-
Вы знаете, почему мы узнали средние, почему не
-
Мы просто использовать средние?
-
Или почему мы не используем арифметическое все время?
-
Что такое средний и режим хорошо для?
-
Ну я постараюсь сделать один из примеров и посмотреть, если
-
Это звучит правдоподобно, с вами.
-
И тогда вы можете думать немного больше.
-
Давайте сказать, что я этот набор чисел.
-
3, 3, 3, 3, 3 и я не знаю, 100.
-
Что такое арифметическое здесь?
-
У меня есть один, два, три, четыре, пять 3 и 100.
-
Поэтому было бы 115, деленная на 6, правильно?
-
Я мог иметь один, два, три, четыре, пять, шесть чисел.
-
115-это просто сумма всех из них.
-
Так что равна--как раз идет 6 в 115?
-
6 идет в его один раз.
-
1 раз 6-6.
-
55 переходит в 9 раз.
-
9 раз 6 — 54.
-
Поэтому она равна 19 1/6.
-
Ярмарка достаточно.
-
Я просто добавил все числа и разделены
-
сколько есть.
-
Но мой вопрос, является ли это действительно представительный
-
из этого набора?
-
Я имею в виду, у меня есть тонны 3 и затем у меня есть 100 все
-
внезапно, и мы говорим, что центральной тенденции является 19 1/6.
-
И, я имею в виду, 19 1/6 не кажется, что действительно ориентировочный
-
из набора.
-
Я имею в виду возможно что он делает, в зависимости от приложения, но он
-
просто кажется немного Выкл, верно?
-
Я имею в виду, что моя интуиция бы что центральной тенденции
-
что-то ближе к 3 потому что есть много 3 в здесь.
-
Так что средний скажет нам?
-
Я уже положил эти номера в порядке, право?
-
Если я даю вам выходит из строя, вы бы хотели поместить его
-
в этом порядке и вы бы сказал что такое средний номер?
-
Давайте посмотрим, среднего два числа, так как у меня
-
даже номер, 3 и 3.
-
Так что если я беру в среднем 3 и 3 — или я должен быть
-
частности с моим языком.
-
Если я беру арифметическое 3 и 3, я получаю 3.
-
И это возможно лучше измерения Центральной
-
тенденция или среднего показателя этого набора чисел, право?
-
По сути, то, что она делает это, принимая средний, я не так
-
много пострадавших от этого действительно большое число, которое очень
-
отличается от других.
-
В статистике они называют это выброс.
-
A число, вы знаете, если вы говорили о среднем дома
-
цены, может быть, каждый дом в городе составляет $ 100 000 и затем
-
есть один дом, который стоит $1 трлн.
-
И затем, если кто-то сказал вам средний дом цена была, я
-
не знаю, $1 млн, вам, возможно, очень неправильно
-
восприятие этого города.
-
Но средний дом цена будет $ 100 000 и вы получите
-
ощущение того, что дома в этом городе, как.
-
Так же этот средний, возможно, дает вам лучше
-
чувство Каковы цифры в этом наборе.
-
Потому что арифметическое был наклонен под этим, что
-
они называют останец.
-
И будучи в состоянии сказать, что выброс, это своего рода
-
Одна из тех вещей, которые статистик будет сказать, ну,
-
Я знаю, когда я вижу его.
-
Там на самом деле не формальное определение для него, но он, как правило
-
чтобы быть такой действительно палочек и иногда
-
Это из-за, вы знаете, ошибка измерения или любой другой.
-
И наконец, режим.
-
Что является наиболее распространенным номер в этом наборе?
-
Ну есть пять 3-100.
-
Это наиболее общий номер, еще раз, это 3.
-
В этом случае, когда у вас этот выброс, медиана и
-
режим, как правило, быть, вы знаете, может быть, они немного
-
лучше о давая вам указание что эти
-
Номера представляют.
-
Может быть, это был просто ошибка измерения.
-
Но я не знаю, мы фактически не знаю
-
то, что они представляют.
-
Если эти цены на жилье, то я бы утверждают, что эти
-
вероятно более ориентировочные меры о том, что
-
дома в области расходов.
-
Но если это что-то другое, если это баллы на тест,
-
может быть, вы знаете, может быть есть один ребенок в классе--один из
-
из шести детей, кто действительно, действительно хорошо и все
-
еще не исследование.
-
И это более свидетельствует о, рода, как студенты
-
Это в среднем уровне сделать.
-
Во всяком случае, я сделал говорить обо всем этом.
-
И я призываю вас, чтобы играть с большим количеством цифр и сделки
-
с понятиями самостоятельно.
-
В следующем видео мы будем изучать более описательный
-
Статистика.
-
Вместо того чтобы говорить о центральной тенденции, мы будем говорить
-
о том, как далеко от распространения отдельно вещи
-
центральной тенденции.
-
Увидимся в следующем видео.