< Return to Video

Jak mylące mogą być statystyki - Mark Liddell

  • 0:07 - 0:09
    Statystyki są przekonujące.
  • 0:09 - 0:13
    Tak przekonujące, że ludzie, organizacje, a nawet całe kraje
  • 0:13 - 0:18
    opierają część swoich kluczowych decyzji na zbiorach danych.
  • 0:18 - 0:19
    Jest z tym jednak pewien problem.
  • 0:19 - 0:23
    W każdym zestawie danych statystycznych może czaić się coś,
  • 0:23 - 0:27
    co może wywrócić do góry nogami przedstawiane wyniki.
  • 0:27 - 0:31
    Przykładowo, wyobraź sobie, że musisz wybrać jeden z dwóch szpitali,
  • 0:31 - 0:34
    w którym Twój krewny w podeszłym wieku podda się operacji.
  • 0:34 - 0:36
    Spośród 1000 ostatnich pacjentów każdego ze szpitali,
  • 0:36 - 0:40
    900 przeżyło w Szpitalu A,
  • 0:40 - 0:43
    podczas gdy zaledwie 800 przeżyło w Szpitalu B.
  • 0:43 - 0:46
    Wygląda więc na to, że Szpital A to lepszy wybór.
  • 0:46 - 0:48
    Jednak zanim podejmiesz decyzję
  • 0:48 - 0:51
    pamiętaj, że nie wszyscy pacjenci przyjmowani do szpitala
  • 0:51 - 0:54
    są w takim samym stanie zdrowia.
  • 0:54 - 0:57
    Jeśli podzielimy ostatnich 1000 pacjentów każdego szpitala
  • 0:57 - 1:01
    na tych w dobrym stanie zdrowia
    i na tych w złym stanie zdrowia,
  • 1:01 - 1:04
    zarysowuje się zupełnie odmienny obraz sytuacji.
  • 1:04 - 1:08
    Szpital A miał zaledwie 100 pacjentów, którzy zostali przyjęci w złym stanie zdrowia,
  • 1:08 - 1:10
    z których przeżyło 30.
  • 1:10 - 1:15
    Podczas gdy Szpital B miał 400, z których przeżyło 210.
  • 1:15 - 1:17
    Zatem Szpital B jest lepszym wyborem
  • 1:17 - 1:21
    dla pacjentów przyjętych do szpitala w słabym stanie
  • 1:21 - 1:25
    ponieważ wskaźnik przeżycia to 52,5%.
  • 1:25 - 1:28
    A co jeśli Twój krewny jest w dobrym stanie zgłaszając się w szpitalu?
  • 1:28 - 1:32
    Co dziwne, Szpital B jest nadal lepszym wyborem
  • 1:32 - 1:36
    ponieważ wskaźnik przeżycia wynosi 98%.
  • 1:36 - 1:39
    Jak to możliwe, że Szpital A ma ogólnie lepsze wyniki przeżywalności
  • 1:39 - 1:45
    skoro Szpital B ma lepsze wskaźniki w obu grupach pacjentów?
  • 1:45 - 1:49
    Trafiliśmy tu na tzw. Paradoks Simpsona.
  • 1:49 - 1:52
    Ten sam zestaw danych zdaje się pokazywać przeciwne trendy
  • 1:52 - 1:55
    w zależności od sposobu pogrupowania danych.
  • 1:55 - 1:59
    Dzieje się tak często, gdy zebrane dane ukrywają zmienną warunkową,
  • 1:59 - 2:01
    czasem nazywaną ukrytą zmienną,
  • 2:01 - 2:07
    która jest ukrytym dodatkowym czynnikiem istotnie wpływającym na wyniki.
  • 2:07 - 2:10
    W tym przypadku ukrytym czynnikiem jest względna proporcja pacjentów
  • 2:10 - 2:13
    przyjmowanych do szpitala w dobrym lub złym stanie zdrowia.
  • 2:13 - 2:17
    Paradoks Simpsona nie jest jedynie scenariuszem hipotetycznym.
  • 2:17 - 2:19
    Ujawnia się czasami w rzeczywistym świecie.
  • 2:19 - 2:22
    Czasem w istotnych sytuacjach.
  • 2:22 - 2:24
    Pewne badanie w Wlk. Brytanii zdawało się wskazywać,
  • 2:24 - 2:28
    że palacze mają wyższe wskaźniki przeżywalności niż niepalący
  • 2:28 - 2:30
    w okresie dwudziestu lat.
  • 2:30 - 2:33
    Kiedy podzielono uczestników na grupy wiekowe
  • 2:33 - 2:38
    wskazano, że niepalący byli znacząco starsi, a tym samym
  • 2:38 - 2:41
    prawdopodobieństwo ich śmierci w okresie badania było większe
  • 2:41 - 2:44
    właśnie dlatego, że ogólnie żyli dłużej.
  • 2:44 - 2:47
    W tym przypadku ukrytą zmienną są grupy wiekowe,
  • 2:47 - 2:50
    a ich znajomość jest kluczowa dla właściwego odczytania wyników.
  • 2:50 - 2:52
    W innym przykładzie,
  • 2:52 - 2:54
    analiza przypadków zastosowania kary śmierci na Florydzie
  • 2:54 - 2:58
    wydawała się wskazywać na równowagę rasową w orzekaniu
  • 2:58 - 3:02
    tej kary dla białych i ciemnoskórych skazanych za morderstwo.
  • 3:02 - 3:06
    Jednak podzielenie tych przypadków według rasy ofiary ujawniło inny obraz sytuacji.
  • 3:06 - 3:08
    W każdym z przypadków
  • 3:08 - 3:11
    ciemnoskórzy oskarżeni częściej byli skazywani na śmierć.
  • 3:11 - 3:15
    Niewiele wyższy całościowy wskaźnik orzekania kary śmierci wobec białych oskarżonych
  • 3:15 - 3:19
    wynikał z tego, że bardziej prawdopodobne było, że sprawy dotyczące białych ofiar
  • 3:19 - 3:21
    zakończą się karą śmierci
  • 3:21 - 3:24
    niż sprawy, w których ofiara była ciemnoskóra,
  • 3:24 - 3:28
    a do większości zabójstw dochodziło wśród ludzi tej samej rasy.
  • 3:28 - 3:31
    Jak zatem uniknąć wpadnięcia w pułapkę tego paradoksu?
  • 3:31 - 3:35
    Niestety nie ma jednej dobrej odpowiedzi.
  • 3:35 - 3:39
    Dane mogą być łączone i dzielone na wiele sposobów,
  • 3:39 - 3:42
    a ogólne liczby mogą czasem dać dokładniejszy obraz
  • 3:42 - 3:47
    niż dane podzielone na wprowadzające w błąd lub arbitralne kategorie.
  • 3:47 - 3:52
    Najważniejsze, aby uważnie analizować rzeczywiste sytuacje opisywane statystykami
  • 3:52 - 3:56
    i uważać, czy nie ma w nich ukrytych zmiennych.
  • 3:56 - 3:59
    W innym przypadku, sami wystawiamy się na wpływ tych, którzy używają danych,
  • 3:59 - 4:03
    aby manipulować innymi i osiągać własne cele.
Title:
Jak mylące mogą być statystyki - Mark Liddell
Speaker:
Mark Liddell
Description:

Statystyki są przekonujące. Tak przekonujące, że ludzie, organizacje, a nawet całe kraje opierają część swoich kluczowych decyzji na zbiorach danych. Jest z tym jednak pewien problem. W każdym zestawie danych statystycznych może czaić się coś, co może wywrócić do góry nogami przedstawiane wyniki. Mark Liddell analizuje Paradoks Simpsona.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:19
TED Translators admin approved Polish subtitles for How statistics can be misleading Jul 7, 2016, 9:09 PM
Maria Jamrozik accepted Polish subtitles for How statistics can be misleading Mar 29, 2016, 6:16 PM
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading Feb 12, 2016, 10:08 PM
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading Feb 12, 2016, 10:08 PM
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading Feb 12, 2016, 10:00 PM
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading Feb 12, 2016, 10:00 PM
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading Feb 12, 2016, 9:56 PM
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading Feb 12, 2016, 9:56 PM
Show all

Polish subtitles

Revisions

  • Revision 11 Edited
    Dariusz Glazewski Feb 12, 2016, 10:08 PM