0:00:06.636,0:00:09.077 Thống kê rất có tính thuyết phục. 0:00:09.077,0:00:12.541 Đến nỗi nhiều người, tổ chức, và [br]đất nước 0:00:12.541,0:00:17.747 đưa ra các quyết định quan trọng[br]dựa trên số liệu. 0:00:17.747,0:00:19.484 Nhưng thống kê có một vấn đề. 0:00:19.484,0:00:23.301 Bất cứ số liệu thống kê nào cũng [br]có điều ẩn chứa đằng sau, 0:00:23.301,0:00:27.251 điều có thể hoàn toàn đảo lộn kết [br]quả. 0:00:27.251,0:00:30.920 Ví dụ như tưởng tượng bạn sẽ chọn [br]một trong hai bệnh viện 0:00:30.920,0:00:33.737 để phẫu thuật cho người thân lớn[br]tuổi của bạn. 0:00:33.737,0:00:36.434 Trong số 1000 bệnh nhân gần đây [br]của mỗi bệnh viện, 0:00:36.434,0:00:39.612 900 người sống sót ở bệnh viện A, 0:00:39.612,0:00:43.021 trong khi chỉ có 800 sống sót ở[br]bệnh viện B. 0:00:43.021,0:00:46.170 Vậy nên có vẻ bệnh viện A là lựa [br]chọn tốt hơn. 0:00:46.170,0:00:47.843 Nhưng trước khi quyết định, 0:00:47.843,0:00:51.411 nhớ rằng không phải tất cả bệnh nhân[br]đến bệnh viện 0:00:51.411,0:00:53.811 với tình trạng sức khỏe giống nhau. 0:00:53.811,0:00:56.703 Và nếu ta chia 1000 bệnh nhân ở mỗi[br]bệnh viện 0:00:56.703,0:01:01.132 thành nhóm người có sức khỏe tốt[br]và nhóm có sức khỏe kém, 0:01:01.132,0:01:03.772 bạn sẽ thấy sự khác biệt. 0:01:03.772,0:01:07.849 Bệnh viện A chỉ có 100 bệnh nhân có[br]sức khỏe kém, 0:01:07.849,0:01:10.325 mà chỉ có 30 người sống sót. 0:01:10.325,0:01:14.852 Nhưng bệnh viện B có 400 người nhưng[br]lại cứu sống 210 người. 0:01:14.852,0:01:17.169 Vì thế bệnh viện B là lựa chọn[br]tốt hơn 0:01:17.169,0:01:20.741 cho bệnh nhân có tình trạng sức [br]khỏe xấu, 0:01:20.741,0:01:24.526 với tỉ lệ sống sót là 52.5%. 0:01:24.526,0:01:28.445 Và nếu sức khỏe người thân bạn tốt [br]khi đến bệnh viện? 0:01:28.445,0:01:32.271 Lạ lùng là bệnh viện B vẫn tốt hơn, 0:01:32.271,0:01:35.676 với tỉ lệ sống sót là 98%. 0:01:35.676,0:01:38.733 Vậy làm sao bệnh viện A lại có tỉ [br]lệ sống sót cao hơn 0:01:38.733,0:01:44.830 khi bệnh viện B có tỉ lệ bệnh nhân [br]sống sót ở mỗi nhóm cao hơn? 0:01:44.830,0:01:48.589 Vấn đề ta gặp phải gọi là Nghịch [br]lí Simpson, 0:01:48.589,0:01:51.899 khi nhóm số liệu giống nhau cho [br]các xu hướng trái ngược 0:01:51.899,0:01:54.374 dựa vào cách nó được phân nhóm. 0:01:54.374,0:01:58.744 Điều này thường xảy ra khi[br]dữ liệu tổng hợp mất một biến có điều kiện 0:01:58.744,0:02:01.377 đôi khi được gọi là biến ẩn, 0:02:01.377,0:02:06.584 là một yếu tố gián tiếp gây ảnh [br]hưởng lớn đến kết quả. 0:02:06.584,0:02:10.023 Ở đây, yếu tố gián tiếp là lượng[br]bệnh nhân 0:02:10.023,0:02:13.264 đến trong tình trạng sức khỏe tốt[br]hay kém. 0:02:13.264,0:02:16.544 Nghịch lí Simpston không chỉ xuất [br]hiện trong lí thuyết. 0:02:16.544,0:02:18.924 Nó còn hay xuất hiện trong cuộc [br]sống, 0:02:18.924,0:02:22.132 thỉnh thoảng còn trong các trường[br]hợp quan trọng. 0:02:22.132,0:02:24.130 Một nghiên cứu ở Anh cho thấy 0:02:24.130,0:02:27.600 lượng người hút thuốc sống sót [br]nhiều hơn người không hút 0:02:27.600,0:02:29.846 trong khoảng thời gian 20 năm. 0:02:29.846,0:02:33.307 Tuy nhiên, khi chia người tham gia[br]nghiên cứu theo nhóm tuổi 0:02:33.307,0:02:37.823 trung bình người không hút thuốc[br]lớn tuổi hơn nhiều, 0:02:37.823,0:02:40.930 và vì thế dễ chết trong thời gian[br]thí nghiệm, 0:02:40.930,0:02:44.438 phần vì họ nhìn chung sống lâu hơn. 0:02:44.438,0:02:47.286 Ở đây, nhóm tuổi chính là biến ẩn, 0:02:47.286,0:02:50.176 và quyết định đến tính đúng đắn[br]của số liệu. 0:02:50.176,0:02:51.559 Trong trường hợp khác, 0:02:51.559,0:02:54.281 một phân tích các vụ tử hình ở[br]Florida 0:02:54.281,0:02:58.265 cho thấy không có sự phân biệt[br]sắc tộc khi tuyên án 0:02:58.265,0:03:01.581 giữa những người da trắng và da đen[br]bị kết tội giết người. 0:03:01.581,0:03:06.396 Nhưng khi chia các trường hợp theo sắc[br]tộc lại có sự khác biệt. 0:03:06.396,0:03:07.969 Trong mỗi trường hợp, 0:03:07.969,0:03:11.091 bị cáo da đen có xu hướng bị án[br]tử hình hơn. 0:03:11.091,0:03:15.066 Nhìn chung tỉ lệ tuyên án cho [br]bị cáo da trắng cao hơn 0:03:15.066,0:03:18.692 bởi vì trường hợp các nạn nhân [br]là người da trắng 0:03:18.692,0:03:21.359 có xu hướng đưa ra án tử hình,[br] 0:03:21.359,0:03:24.091 hơn trường hợp nạn nhân là người[br]da đen, 0:03:24.091,0:03:28.483 và phần lớn vụ giết người diễn ra [br]giữa nguời cùng màu da. 0:03:28.483,0:03:31.319 Vậy làm sao để tránh nghịch lí này? 0:03:31.319,0:03:34.686 Tiếc rằng, không có câu trả lời nào[br]đúng cho mọi trường hợp. 0:03:34.686,0:03:38.504 Số liệu có thể được nhóm lại và[br]chia ra theo nhiều cách khác nhau, 0:03:38.504,0:03:42.106 và các số liệu tổng hợp thường đưa[br]ra kết quả chính xác 0:03:42.106,0:03:46.258 hơn là số liệu được phân chia thành [br]các nhóm không phù hợp. 0:03:46.258,0:03:52.089 Những gì ta có thể làm là khảo sát kĩ[br]các tình huống thực tế được mô tả 0:03:52.089,0:03:55.977 và xem xét khả năng xuất hiện của[br]các thay đổi ẩn. 0:03:55.977,0:03:59.378 Nếu không, ta sẽ dễ trở thành đối tượng[br]của những người dùng thông tin 0:04:18.985,0:04:22.985 để chi phối người khác và[br]phục vụ cho lợi ích của bản thân.