WEBVTT 00:00:08.141 --> 00:00:08.441 Uma das 00:00:08.441 --> 00:00:11.811 maneiras de se aprender é fazendo na prática. 00:00:11.911 --> 00:00:15.482 E agora nós temos um case para trazer aqui que nós iremos 00:00:15.482 --> 00:00:20.053 conseguir executar a partir de hipóteses e intervalos. 00:00:20.120 --> 00:00:21.354 Pense no cenário. 00:00:21.354 --> 00:00:24.924 Vocês têm um sistema que o sistema não está performando 00:00:24.924 --> 00:00:28.194 muito bem e aí é feita uma análise e colete. 00:00:28.194 --> 00:00:29.496 São coletados os dados 00:00:29.496 --> 00:00:33.399 e de hora em hora, quanto que está a performance daquele sistema? 00:00:33.466 --> 00:00:39.139 Então é estudado e verificado que existe a possibilidade de se melhorar o algoritmo 00:00:39.205 --> 00:00:44.110 e implementar essas melhorias do algoritmo e posteriormente 00:00:44.110 --> 00:00:48.481 são coletados novamente os dados com relação à performance do sistema. 00:00:48.548 --> 00:00:51.551 Então você tem o antes e o depois. 00:00:51.684 --> 00:00:56.055 Se você tem o antes e o depois dos dados, você pode comparar. 00:00:56.122 --> 00:00:58.658 Se for um intervalo bem pequeno, talvez você 00:00:58.658 --> 00:01:01.995 consiga no seu papel ali olhando comparar. 00:01:02.061 --> 00:01:05.398 Mas imagine uma situação real em uma empresa que um sistema 00:01:05.398 --> 00:01:09.469 fica processando durante 24 horas durante um mês. 00:01:09.535 --> 00:01:10.103 Quanto? 00:01:10.103 --> 00:01:13.506 Quanto os dados você tem ali para fazer essa comparação? 00:01:13.573 --> 00:01:17.777 Então vamos fazer isso aqui na prática, deixar o script pré pronto, 00:01:17.877 --> 00:01:21.314 sempre daquela maneira, deixando essa parte com a hashtag, 00:01:21.481 --> 00:01:24.751 que é um resumo teórico do que nós 00:01:24.751 --> 00:01:28.488 iremos analisar, até mesmo algumas explicações 00:01:28.588 --> 00:01:31.591 um pouco mais técnica ou com a parte de estatística. 00:01:31.791 --> 00:01:34.360 Então, aqui nós temos duas bases de dados. 00:01:34.360 --> 00:01:35.395 Se você apertar um entre, 00:01:35.395 --> 00:01:38.798 isso vai ser executado, mas a gente sempre gosta de fazer na prática. 00:01:38.865 --> 00:01:42.068 Vamos apertar Ao entrar aqui, 00:01:42.135 --> 00:01:46.439 nós iremos copiar essas duas bases de dados, porque se traz pronto. 00:01:46.539 --> 00:01:48.307 Não precisa criar agora duas. 00:01:48.307 --> 00:01:50.243 Dois conjuntos de dados. 00:01:50.243 --> 00:01:51.611 Ou vou limpar aqui. 00:01:51.611 --> 00:01:53.980 Vamos interpretar o que nós temos 00:01:53.980 --> 00:01:57.550 são os dados para análise, ou pode tirar isso daqui, o sinalzinho. 00:01:57.617 --> 00:02:02.055 Então nós temos aqui antes da implementação do algoritmo. 00:02:02.121 --> 00:02:05.058 Vamos supor que nós for o que foi analisado. 00:02:05.058 --> 00:02:09.195 Nós temos aqui um, ora um, ora dois, ora três, 00:02:09.195 --> 00:02:14.033 ora quatro, ora 05h00, 06h07 e hora oito. 00:02:14.133 --> 00:02:17.036 Então, antes de implementar essa melhoria no algoritmo, 00:02:17.036 --> 00:02:19.705 esses são os valores dos tempo de execução. 00:02:19.705 --> 00:02:21.607 Vamos supor em segundos. 00:02:21.607 --> 00:02:23.543 E aí foi implementado a melhoria. 00:02:23.543 --> 00:02:27.146 E aí fez uma nova, Fizeram uma nova coleta de dados. 00:02:27.246 --> 00:02:30.216 E aí, em segundos, quanto tempo demorou? 00:02:30.216 --> 00:02:33.219 "Se você olhar aqui, Rafa, não precisa nem processar. 00:02:33.286 --> 00:02:36.756 Já fica visível que sim, está melhor." 00:02:36.823 --> 00:02:37.390 Mas lembre-se que, no dia a dia, 00:02:38.908 --> 00:02:39.908 você geralmente tem um conjunto de dados muito maior. 00:02:41.427 --> 00:02:46.933 Então, se você for fazer análise no papel, você vai demorar muitas horas. 00:02:46.999 --> 00:02:50.203 E aqui, o mesmo script que nós vamos executar agora, 00:02:50.269 --> 00:02:55.141 serve para um conjunto pequeno de dados como esse ou para um conjunto muito maior. 00:02:55.208 --> 00:02:56.809 Vamos ver como fica. 00:02:56.809 --> 00:03:00.913 Então nós vamos apertar Enter aqui e sempre. 00:03:00.980 --> 00:03:03.449 Não é obrigatório, mas é sempre legal 00:03:03.449 --> 00:03:07.620 você visualizar os dados para confirmar que está tudo certinho. 00:03:07.720 --> 00:03:12.224 Criamos o tempo antes e pedimos para mostrar o tempo antes. 00:03:12.291 --> 00:03:16.996 Vamos apertar 2 a 3 aqui, gente, vamos mostrar ele de novo. 00:03:16.996 --> 00:03:21.934 Você pode digitar tempos depois 00:03:22.001 --> 00:03:26.806 ou você pode utilizar a sugestão dele para cima ou apertar enter. 00:03:26.872 --> 00:03:30.109 Então nós criamos aqui 00:03:30.209 --> 00:03:32.678 o antes e o depois. 00:03:32.678 --> 00:03:33.045 Legal! 00:03:33.045 --> 00:03:35.915 Vamos subir um pouquinho então, aqui novamente 00:03:35.915 --> 00:03:38.951 naquela velha dica se tem alguma dúvida das análises 00:03:38.951 --> 00:03:41.987 que iremos fazer, fica um resumo aqui para vocês. 00:03:41.987 --> 00:03:44.390 Pode pausar e anotar aqui. 00:03:44.390 --> 00:03:48.928 São os dois dados, os dois conjuntos de dados que acabamos de criar. 00:03:49.028 --> 00:03:51.931 E agora nós vamos para uma próxima parte. 00:03:51.931 --> 00:03:55.434 Deixa eu pegar, Rafa, tem mais comentário aí do que execução. 00:03:55.668 --> 00:03:59.071 Sim, é sempre legal vocês terem esse resumo. 00:03:59.171 --> 00:04:01.640 Eu gosto deixar um resumo para vocês. 00:04:01.640 --> 00:04:05.745 Vou dar um repertório entra aqui, tela fica um pouco limpo, 00:04:05.945 --> 00:04:10.216 deixa eu só arrumar aqui só um minuto que nós temos aqui. 00:04:10.216 --> 00:04:11.984 Rafa. 00:04:11.984 --> 00:04:13.686 Porque voltando a primeira 00:04:13.686 --> 00:04:17.056 que é o título, realizando o teste de hipóteses. 00:04:17.123 --> 00:04:22.128 E aí, aqui nós temos o que nós queremos analisar, eu vou apertar o entre, 00:04:22.128 --> 00:04:25.231 vou imprimir e aí nós vamos interpretando, iremos interpretar junto. 00:04:25.264 --> 00:04:28.534 Tudo bem, para teste um de lá na hipótese legal. 00:04:28.601 --> 00:04:33.038 Que construção que é essa, Rafa, que vocês escutou e você ainda não ensinou? 00:04:33.305 --> 00:04:35.307 Vamos tentar entender o que está aqui. 00:04:35.307 --> 00:04:37.576 Vamos tentar? Não vamos entender, né? 00:04:37.576 --> 00:04:42.314 Teste anterior Hipótese é um nome de uma variável, aí sinal de menor assim. 00:04:42.448 --> 00:04:46.886 Então o que acontecer aqui será atribuído para dentro desse 00:04:46.986 --> 00:04:50.522 essa variável tender lá teste 00:04:50.589 --> 00:04:54.193 e mais um tema que vocês precisam aprender. 00:04:54.260 --> 00:04:56.195 O que seria isso? 00:04:56.195 --> 00:04:57.796 Oh, ele é usado. 00:04:57.796 --> 00:05:01.166 Ele é mais usado para comparar a média de dois grupos 00:05:01.267 --> 00:05:06.238 e determinar estatisticamente se há diferença entre eles. 00:05:06.338 --> 00:05:08.874 Então nós não temos duas bases de dados. 00:05:08.874 --> 00:05:14.179 Oh, vamos lembrar que a base de dados da análise da performance do sistema do antes 00:05:14.280 --> 00:05:18.917 e a análise dos dados com a base de dados do depois com a performance. 00:05:18.984 --> 00:05:19.752 Se você olhar 00:05:19.752 --> 00:05:22.988 1A1, se vai ver que está melhor mesmo. 00:05:23.122 --> 00:05:25.691 Mas vamos deixar para o R fazer isso para nós. 00:05:25.691 --> 00:05:28.027 Então nós temos que fornecer a base de dados, 00:05:28.027 --> 00:05:31.997 o conjunto de dados do antes e do depois. 00:05:32.064 --> 00:05:37.236 E aqui o que a gente faz é uma instrução para dizer que nós estamos 00:05:37.236 --> 00:05:41.373 fazendo uma comparação com essas duas, com duas bases de dados. 00:05:41.440 --> 00:05:44.576 Rafa Poderíamos fazer uma análise com mais base de dados? 00:05:44.777 --> 00:05:45.711 Sim, poderíamos. 00:05:45.711 --> 00:05:48.714 Aqui nós só estamos comparando duas. 00:05:48.814 --> 00:05:53.118 E aí você fala Nossa, Rafa, saiu um resultado aí um pouquinho extenso. 00:05:53.185 --> 00:05:55.120 Calma aí que nós iremos interpretar ele. 00:05:55.120 --> 00:05:58.123 Tudo bem? Vem aqui comigo, por favor. 00:05:58.123 --> 00:05:59.124 Então o que nós fizemos? 00:05:59.124 --> 00:06:01.427 Estamos indo interpretar aquele resultado 00:06:01.427 --> 00:06:05.697 que estão os comentários, os dados do antes e do depois. 00:06:05.798 --> 00:06:08.333 Uma primeira, 00:06:08.333 --> 00:06:11.670 primeira, o teste de hipótese que nós fizemos. 00:06:11.770 --> 00:06:14.506 E aqui nós vamos imprimir esse resultado do teste, hipótese 00:06:14.506 --> 00:06:16.175 que é o que a gente acabou de fazer. 00:06:16.175 --> 00:06:20.145 Vou deixar só comentado, mas vai se fazer a mesma saída, tá? 00:06:20.212 --> 00:06:21.914 Então 00:06:21.914 --> 00:06:24.049 o que nós temos aqui? 00:06:24.049 --> 00:06:25.651 Como que a gente pode interpretar? 00:06:25.651 --> 00:06:29.454 Você só mandou imprimir e colocou o título aqui, que é o resto entregue. 00:06:29.555 --> 00:06:34.793 E aí você tem que novamente focar na análise da saída dos dados. 00:06:34.893 --> 00:06:39.598 Tem esse p value aqui, que é um dos focos da nossa análise. 00:06:39.698 --> 00:06:42.668 Se vocês voltarem aqui para o começo, 00:06:42.868 --> 00:06:45.871 vocês podem tirar algumas análise 00:06:46.071 --> 00:06:49.942 do que a gente está buscando ou os intervalos de confiança. 00:06:49.942 --> 00:06:54.279 Usado para estimar a incerteza associada a uma estimativa pontual. 00:06:54.346 --> 00:06:59.451 O quanto a gente tem a certeza ou incerteza que isso está nos ajudando. 00:06:59.551 --> 00:07:02.554 Então, aqui nós conseguimos fazer com que a linguagem R 00:07:02.688 --> 00:07:06.458 fizesse essa análise do tempo, o antes e o depois, 00:07:06.525 --> 00:07:10.062 olhando antes da execução, nós conseguimos ter a certeza. 00:07:10.128 --> 00:07:13.198 Mas lembre se sempre no dia a dia do seu trabalho, 00:07:13.198 --> 00:07:16.201 na sua vida pessoal, você vai precisar analisar dados 00:07:16.401 --> 00:07:20.639 que geralmente esse conjunto de dados é muito maior. 00:07:20.739 --> 00:07:24.576 Então utilize o R para que faça essa análise por você. 00:07:24.643 --> 00:07:30.215 E agora fica uma dica pense em um cenário, algo da sua vida pessoal 00:07:30.215 --> 00:07:34.219 ou de algum familiar seu, ou até mesmo da sua empresa que você tem 00:07:34.219 --> 00:07:38.924 esse conjunto de dados do antes e o depois e você precisa fazer essa análise, 00:07:38.990 --> 00:07:41.993 de preferência um conjunto de dados até maior, 00:07:42.027 --> 00:07:45.697 e aí você tente executar esse script novamente, 00:07:45.764 --> 00:07:50.235 buscando essa análise nos comentários e você consiga chegar no seu resultado. 00:07:50.469 --> 00:07:53.305 Então você terá certeza que fazendo na prática 00:07:53.305 --> 00:07:56.741 você consegue absorver esse conhecimento e.