Обманчивая статистика — Марк Лиддел
-
0:07 - 0:09Статистика убедительна.
-
0:09 - 0:13Настолько, что люди,
организации и целые страны -
0:13 - 0:18принимают важнейшие решения,
опираясь на систематизированные данные. -
0:18 - 0:19Но существует проблема.
-
0:19 - 0:23В любом наборе статистических данных
может таиться то, -
0:23 - 0:27что способно полностью перевернуть
результаты с ног на голову. -
0:27 - 0:31Представьте, что вам нужно выбрать
одну из двух больниц -
0:31 - 0:34для операции пожилого родственника.
-
0:34 - 0:36Из последней тысячи пациентов этих больниц
-
0:36 - 0:40в больнице А выжило 900 человек,
-
0:40 - 0:43а в больнице Б — 800.
-
0:43 - 0:46Похоже, что больница А — лучший выбор.
-
0:46 - 0:48Но принимая решение, имейте в виду,
-
0:48 - 0:51что состояние здоровья пациентов,
прибывших в больницу, -
0:51 - 0:54было неодинаковым.
-
0:54 - 0:57Если разделить последнюю тысячу
пациентов обеих больниц -
0:57 - 1:01на тех, кто прибыл в хорошем
и в плохом состоянии здоровья, -
1:01 - 1:04получится совсем другая картина.
-
1:04 - 1:08В больницу А прибыло лишь 100 пациентов
в плохом состоянии здоровья, -
1:08 - 1:10из которых 30 выжили.
-
1:10 - 1:15В больницу Б поступило 400 тяжелобольных,
из которых удалось спасти 210. -
1:15 - 1:17Таким образом больница Б —
лучший выбор -
1:17 - 1:21для пациентов, прибывающих
в плохом состоянии здоровья, -
1:21 - 1:25с коэффициентом выживаемости — 52,5 %.
-
1:25 - 1:28А если на момент поступления в больницу
здоровье вашего родственника в норме? -
1:28 - 1:32Удивительно, но и тут больница Б —
лучший выбор -
1:32 - 1:36с коэффициентом выживаемости — 98%.
-
1:36 - 1:39Но почему у больницы А
суммарный показатель выживаемости выше, -
1:39 - 1:45если у больницы Б выше показатель
выживаемости пациентов обеих групп? -
1:45 - 1:49То, с чем мы столкнулись,
называется парадоксом Симпсона, -
1:49 - 1:52при котором набор данных
может показывать обратную тенденцию -
1:52 - 1:55в зависимости от того,
как он сгруппирован. -
1:55 - 1:59Такое случается, когда сводные данные
содержат условную переменную, -
1:59 - 2:01также известную, как скрытая переменная.
-
2:01 - 2:07Это скрытый дополнительный фактор,
существенно влияющий на результаты. -
2:07 - 2:10В данном случае скрытый фактор —
это доля пациентов, -
2:10 - 2:13прибывших в хорошем
или плохом состоянии здоровья. -
2:13 - 2:17Парадокс Симпсона —
это не просто гипотетический сценарий. -
2:17 - 2:19Время от времени
он возникает в реальном мире, -
2:19 - 2:22иногда при важных обстоятельствах.
-
2:22 - 2:24Исследование,
проведённое в Великобритании, -
2:24 - 2:28показало более высокую долю выживаемости
курящих людей, нежели некурящих, -
2:28 - 2:30более чем за 20-летний период времени.
-
2:30 - 2:33Но разделение участников
на возрастные группы -
2:33 - 2:38показало, что некурящие, в среднем,
были существенно старше, -
2:38 - 2:41а значит имели больше шансов
умереть во время испытательного срока -
2:41 - 2:44именно потому,
что они в целом прожили больше. -
2:44 - 2:47Здесь скрытой переменной
являются возрастные группы, -
2:47 - 2:50крайне важные для корректной
интерпретации данных. -
2:50 - 2:52Другой пример:
-
2:52 - 2:54анализ случаев смертной казни во Флориде
-
2:54 - 2:58не выявил расового неравенства
при вынесении приговоров -
2:58 - 3:02чернокожим и белым людям,
обвиняемым в убийстве. -
3:02 - 3:06Но разделение дел по расам жертв
рассказало другую историю. -
3:06 - 3:08При прочих равных обстоятельствах
-
3:08 - 3:11чернокожим обвиняемым
чаще выносили смертный приговор. -
3:11 - 3:15Немного большее количество приговоров
для белых ответчиков было связано с тем, -
3:15 - 3:19что делá об убийстве белых людей
-
3:19 - 3:21чаще приводили преступника
к смертному приговору, -
3:21 - 3:24чем делá, где жертвы были чернокожими,
-
3:24 - 3:28а большинство убийств совершалось
между представителями одной расы. -
3:28 - 3:31Так как же избежать выводов,
содержащих парадокс? -
3:31 - 3:35К несчастью,
универсального ответа не существует. -
3:35 - 3:39Данные могут быть сгруппированы
и разделены любым количеством способов, -
3:39 - 3:42и иногда суммарный показатель
даёт более точную картину, -
3:42 - 3:47чем данные, разделённые
на случайные категории. -
3:47 - 3:52Всё, что можно сделать — тщательно изучить
ситуации, описываемые статистикой, -
3:52 - 3:56и решить, возможно ли здесь
присутствие скрытой переменной. -
3:56 - 3:59В противном случае мы беззащитны
перед теми, кто использует данные -
3:59 - 4:03для манипуляции другими людьми
в собственных интересах.
- Title:
- Обманчивая статистика — Марк Лиддел
- Speaker:
- Mark Liddell
- Description:
-
Смотрите полную версию урока: http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell
Статистика убедительна настолько, что множество людей, организаций и даже стран принимают некоторые из важнейших решений, основываясь на её показателях. Но любой набор статистических данных может содержать в себе некий скрытый фактор, до неузнаваемости меняющий результаты исследования. В этом видео Марк Лиддел исследует парадокс Симпсона.
Урок Марка Лиддела, анимация — Tinmouse Animation Studio
- Video Language:
- English
- Team:
closed TED
- Project:
- TED-Ed
- Duration:
- 04:19
![]() |
Retired user edited Russian subtitles for How statistics can be misleading | |
![]() |
Retired user edited Russian subtitles for How statistics can be misleading | |
![]() |
Retired user approved Russian subtitles for How statistics can be misleading | |
![]() |
Retired user edited Russian subtitles for How statistics can be misleading | |
![]() |
Катерина Джусупова accepted Russian subtitles for How statistics can be misleading | |
![]() |
Катерина Джусупова edited Russian subtitles for How statistics can be misleading | |
![]() |
Катерина Джусупова edited Russian subtitles for How statistics can be misleading | |
![]() |
Катерина Джусупова edited Russian subtitles for How statistics can be misleading |