< Return to Video

Обманчивая статистика — Марк Лиддел

  • 0:07 - 0:09
    Статистика убедительна.
  • 0:09 - 0:13
    Настолько, что люди,
    организации и целые страны
  • 0:13 - 0:18
    принимают важнейшие решения,
    опираясь на систематизированные данные.
  • 0:18 - 0:19
    Но существует проблема.
  • 0:19 - 0:23
    В любом наборе статистических данных
    может таиться то,
  • 0:23 - 0:27
    что способно полностью перевернуть
    результаты с ног на голову.
  • 0:27 - 0:31
    Представьте, что вам нужно выбрать
    одну из двух больниц
  • 0:31 - 0:34
    для операции пожилого родственника.
  • 0:34 - 0:36
    Из последней тысячи пациентов этих больниц
  • 0:36 - 0:40
    в больнице А выжило 900 человек,
  • 0:40 - 0:43
    а в больнице Б — 800.
  • 0:43 - 0:46
    Похоже, что больница А — лучший выбор.
  • 0:46 - 0:48
    Но принимая решение, имейте в виду,
  • 0:48 - 0:51
    что состояние здоровья пациентов,
    прибывших в больницу,
  • 0:51 - 0:54
    было неодинаковым.
  • 0:54 - 0:57
    Если разделить последнюю тысячу
    пациентов обеих больниц
  • 0:57 - 1:01
    на тех, кто прибыл в хорошем
    и в плохом состоянии здоровья,
  • 1:01 - 1:04
    получится совсем другая картина.
  • 1:04 - 1:08
    В больницу А прибыло лишь 100 пациентов
    в плохом состоянии здоровья,
  • 1:08 - 1:10
    из которых 30 выжили.
  • 1:10 - 1:15
    В больницу Б поступило 400 тяжелобольных,
    из которых удалось спасти 210.
  • 1:15 - 1:17
    Таким образом больница Б —
    лучший выбор
  • 1:17 - 1:21
    для пациентов, прибывающих
    в плохом состоянии здоровья,
  • 1:21 - 1:25
    с коэффициентом выживаемости — 52,5 %.
  • 1:25 - 1:28
    А если на момент поступления в больницу
    здоровье вашего родственника в норме?
  • 1:28 - 1:32
    Удивительно, но и тут больница Б —
    лучший выбор
  • 1:32 - 1:36
    с коэффициентом выживаемости — 98%.
  • 1:36 - 1:39
    Но почему у больницы А
    суммарный показатель выживаемости выше,
  • 1:39 - 1:45
    если у больницы Б выше показатель
    выживаемости пациентов обеих групп?
  • 1:45 - 1:49
    То, с чем мы столкнулись,
    называется парадоксом Симпсона,
  • 1:49 - 1:52
    при котором набор данных
    может показывать обратную тенденцию
  • 1:52 - 1:55
    в зависимости от того,
    как он сгруппирован.
  • 1:55 - 1:59
    Такое случается, когда сводные данные
    содержат условную переменную,
  • 1:59 - 2:01
    также известную, как скрытая переменная.
  • 2:01 - 2:07
    Это скрытый дополнительный фактор,
    существенно влияющий на результаты.
  • 2:07 - 2:10
    В данном случае скрытый фактор —
    это доля пациентов,
  • 2:10 - 2:13
    прибывших в хорошем
    или плохом состоянии здоровья.
  • 2:13 - 2:17
    Парадокс Симпсона —
    это не просто гипотетический сценарий.
  • 2:17 - 2:19
    Время от времени
    он возникает в реальном мире,
  • 2:19 - 2:22
    иногда при важных обстоятельствах.
  • 2:22 - 2:24
    Исследование,
    проведённое в Великобритании,
  • 2:24 - 2:28
    показало более высокую долю выживаемости
    курящих людей, нежели некурящих,
  • 2:28 - 2:30
    более чем за 20-летний период времени.
  • 2:30 - 2:33
    Но разделение участников
    на возрастные группы
  • 2:33 - 2:38
    показало, что некурящие, в среднем,
    были существенно старше,
  • 2:38 - 2:41
    а значит имели больше шансов
    умереть во время испытательного срока
  • 2:41 - 2:44
    именно потому,
    что они в целом прожили больше.
  • 2:44 - 2:47
    Здесь скрытой переменной
    являются возрастные группы,
  • 2:47 - 2:50
    крайне важные для корректной
    интерпретации данных.
  • 2:50 - 2:52
    Другой пример:
  • 2:52 - 2:54
    анализ случаев смертной казни во Флориде
  • 2:54 - 2:58
    не выявил расового неравенства
    при вынесении приговоров
  • 2:58 - 3:02
    чернокожим и белым людям,
    обвиняемым в убийстве.
  • 3:02 - 3:06
    Но разделение дел по расам жертв
    рассказало другую историю.
  • 3:06 - 3:08
    При прочих равных обстоятельствах
  • 3:08 - 3:11
    чернокожим обвиняемым
    чаще выносили смертный приговор.
  • 3:11 - 3:15
    Немного большее количество приговоров
    для белых ответчиков было связано с тем,
  • 3:15 - 3:19
    что делá об убийстве белых людей
  • 3:19 - 3:21
    чаще приводили преступника
    к смертному приговору,
  • 3:21 - 3:24
    чем делá, где жертвы были чернокожими,
  • 3:24 - 3:28
    а большинство убитых
    были представителями одной расы.
  • 3:28 - 3:31
    Так как же избежать выводов,
    содержащих парадокс?
  • 3:31 - 3:35
    К несчастью,
    универсального ответа не существует.
  • 3:35 - 3:39
    Данные могут быть сгруппированы
    и разделены любым количеством способов,
  • 3:39 - 3:42
    и иногда суммарный показатель
    даёт более точную картину,
  • 3:42 - 3:47
    чем данные, разделённые
    на случайные категории.
  • 3:47 - 3:52
    Всё, что можно сделать — тщательно изучить
    ситуации, описываемые статистикой,
  • 3:52 - 3:56
    и решить, возможно ли здесь
    присутствие скрытой переменной.
  • 3:56 - 3:59
    В противном случае мы беззащитны
    перед теми, кто использует данные
  • 3:59 - 4:03
    для манипуляции другими людьми
    в собственных интересах.
Title:
Обманчивая статистика — Марк Лиддел
Speaker:
Mark Liddell
Description:

Смотрите полную версию урока: http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell

Статистика убедительна настолько, что множество людей, организаций и даже стран принимают некоторые из важнейших решений, основываясь на её показателях. Но любой набор статистических данных может содержать в себе некий скрытый фактор, до неузнаваемости меняющий результаты исследования. В этом видео Марк Лиддел исследует парадокс Симпсона.

Урок Марка Лиддела, анимация — Tinmouse Animation Studio

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:19
Retired user edited Russian subtitles for How statistics can be misleading Aug 8, 2016, 10:48 AM
Retired user edited Russian subtitles for How statistics can be misleading Aug 8, 2016, 10:46 AM
Retired user approved Russian subtitles for How statistics can be misleading Aug 8, 2016, 10:39 AM
Retired user edited Russian subtitles for How statistics can be misleading Aug 8, 2016, 10:39 AM
Катерина Джусупова accepted Russian subtitles for How statistics can be misleading Aug 5, 2016, 9:09 AM
Катерина Джусупова edited Russian subtitles for How statistics can be misleading Aug 5, 2016, 9:09 AM
Катерина Джусупова edited Russian subtitles for How statistics can be misleading Aug 5, 2016, 9:05 AM
Катерина Джусупова edited Russian subtitles for How statistics can be misleading Aug 5, 2016, 8:54 AM
Show all

Russian subtitles

Revisions Compare revisions