1 00:00:08,141 --> 00:00:08,441 Uma das 2 00:00:08,441 --> 00:00:11,811 maneiras de se aprender é fazendo na prática. 3 00:00:11,911 --> 00:00:15,482 E agora nós temos um case para trazer aqui que nós iremos 4 00:00:15,482 --> 00:00:20,053 conseguir executar a partir de hipóteses e intervalos. 5 00:00:20,120 --> 00:00:21,354 Pense no cenário. 6 00:00:21,354 --> 00:00:24,924 Vocês têm um sistema que o sistema não está performando 7 00:00:24,924 --> 00:00:28,194 muito bem e aí é feita uma análise e colete. 8 00:00:28,194 --> 00:00:29,496 São coletados os dados 9 00:00:29,496 --> 00:00:33,399 e de hora em hora, quanto que está a performance daquele sistema? 10 00:00:33,466 --> 00:00:39,139 Então é estudado e verificado que existe a possibilidade de se melhorar o algoritmo 11 00:00:39,205 --> 00:00:44,110 e implementar essas melhorias do algoritmo e posteriormente 12 00:00:44,110 --> 00:00:48,481 são coletados novamente os dados com relação à performance do sistema. 13 00:00:48,548 --> 00:00:51,551 Então você tem o antes e o depois. 14 00:00:51,684 --> 00:00:56,055 Se você tem o antes e o depois dos dados, você pode comparar. 15 00:00:56,122 --> 00:00:58,658 Se for um intervalo bem pequeno, talvez você 16 00:00:58,658 --> 00:01:01,995 consiga no seu papel ali olhando comparar. 17 00:01:02,061 --> 00:01:05,398 Mas imagine uma situação real em uma empresa que um sistema 18 00:01:05,398 --> 00:01:09,469 fica processando durante 24 horas durante um mês. 19 00:01:09,535 --> 00:01:10,103 Quanto? 20 00:01:10,103 --> 00:01:13,506 Quanto os dados você tem ali para fazer essa comparação? 21 00:01:13,573 --> 00:01:17,777 Então vamos fazer isso aqui na prática, deixar o script pré pronto, 22 00:01:17,877 --> 00:01:21,314 sempre daquela maneira, deixando essa parte com a hashtag, 23 00:01:21,481 --> 00:01:24,751 que é um resumo teórico do que nós 24 00:01:24,751 --> 00:01:28,488 iremos analisar, até mesmo algumas explicações 25 00:01:28,588 --> 00:01:31,591 um pouco mais técnica ou com a parte de estatística. 26 00:01:31,791 --> 00:01:34,360 Então, aqui nós temos duas bases de dados. 27 00:01:34,360 --> 00:01:35,395 Se você apertar um entre, 28 00:01:35,395 --> 00:01:38,798 isso vai ser executado, mas a gente sempre gosta de fazer na prática. 29 00:01:38,865 --> 00:01:42,068 Vamos apertar Ao entrar aqui, 30 00:01:42,135 --> 00:01:46,439 nós iremos copiar essas duas bases de dados, porque se traz pronto. 31 00:01:46,539 --> 00:01:48,307 Não precisa criar agora duas. 32 00:01:48,307 --> 00:01:50,243 Dois conjuntos de dados. 33 00:01:50,243 --> 00:01:51,611 Ou vou limpar aqui. 34 00:01:51,611 --> 00:01:53,980 Vamos interpretar o que nós temos 35 00:01:53,980 --> 00:01:57,550 são os dados para análise, ou pode tirar isso daqui, o sinalzinho. 36 00:01:57,617 --> 00:02:02,055 Então nós temos aqui antes da implementação do algoritmo. 37 00:02:02,121 --> 00:02:05,058 Vamos supor que nós for o que foi analisado. 38 00:02:05,058 --> 00:02:09,195 Nós temos aqui um, ora um, ora dois, ora três, 39 00:02:09,195 --> 00:02:14,033 ora quatro, ora 05h00, 06h07 e hora oito. 40 00:02:14,133 --> 00:02:17,036 Então, antes de implementar essa melhoria no algoritmo, 41 00:02:17,036 --> 00:02:19,705 esses são os valores dos tempo de execução. 42 00:02:19,705 --> 00:02:21,607 Vamos supor em segundos. 43 00:02:21,607 --> 00:02:23,543 E aí foi implementado a melhoria. 44 00:02:23,543 --> 00:02:27,146 E aí fez uma nova, Fizeram uma nova coleta de dados. 45 00:02:27,246 --> 00:02:30,216 E aí, em segundos, quanto tempo demorou? 46 00:02:30,216 --> 00:02:33,219 Se você olhar aqui, Rafa, não precisa nem processar. 47 00:02:33,286 --> 00:02:36,756 Já fica visível que sim, está melhor. 48 00:02:36,823 --> 00:02:37,390 Mas lembre se 49 00:02:37,390 --> 00:02:41,194 que no dia a dia, geralmente você tem um conjunto de dados muito maior. 50 00:02:41,427 --> 00:02:46,933 Então você, se você for fazer análise no papel, você vai demorar muitas horas. 51 00:02:46,999 --> 00:02:50,203 E aqui o mesmo script que nós vamos executar agora 52 00:02:50,269 --> 00:02:55,141 serve para um conjunto pequeno de dados como esse ou como um conjunto muito maior. 53 00:02:55,208 --> 00:02:56,809 Vamos ver como é que fica. 54 00:02:56,809 --> 00:03:00,913 Então nós vamos apertar enter aqui e sempre. 55 00:03:00,980 --> 00:03:03,449 Não é obrigatório, mas é sempre legal 56 00:03:03,449 --> 00:03:07,620 você visualizar os dados para confirmar que está tudo certinho. 57 00:03:07,720 --> 00:03:12,224 Criamos o tempo antes e pedimos para mostrar o tempo antes. 58 00:03:12,291 --> 00:03:16,996 Vamos apertar 2 a 3 aqui, gente, vamos mostrar ele de novo. 59 00:03:16,996 --> 00:03:21,934 Você pode digitar tempos depois 60 00:03:22,001 --> 00:03:26,806 ou você pode utilizar a sugestão dele para cima ou apertar enter. 61 00:03:26,872 --> 00:03:30,109 Então nós criamos aqui 62 00:03:30,209 --> 00:03:32,678 o antes e o depois. 63 00:03:32,678 --> 00:03:33,045 Legal! 64 00:03:33,045 --> 00:03:35,915 Vamos subir um pouquinho então, aqui novamente 65 00:03:35,915 --> 00:03:38,951 naquela velha dica se tem alguma dúvida das análises 66 00:03:38,951 --> 00:03:41,987 que iremos fazer, fica um resumo aqui para vocês. 67 00:03:41,987 --> 00:03:44,390 Pode pausar e anotar aqui. 68 00:03:44,390 --> 00:03:48,928 São os dois dados, os dois conjuntos de dados que acabamos de criar. 69 00:03:49,028 --> 00:03:51,931 E agora nós vamos para uma próxima parte. 70 00:03:51,931 --> 00:03:55,434 Deixa eu pegar, Rafa, tem mais comentário aí do que execução. 71 00:03:55,668 --> 00:03:59,071 Sim, é sempre legal vocês terem esse resumo. 72 00:03:59,171 --> 00:04:01,640 Eu gosto deixar um resumo para vocês. 73 00:04:01,640 --> 00:04:05,745 Vou dar um repertório entra aqui, tela fica um pouco limpo, 74 00:04:05,945 --> 00:04:10,216 deixa eu só arrumar aqui só um minuto que nós temos aqui. 75 00:04:10,216 --> 00:04:11,984 Rafa. 76 00:04:11,984 --> 00:04:13,686 Porque voltando a primeira 77 00:04:13,686 --> 00:04:17,056 que é o título, realizando o teste de hipóteses. 78 00:04:17,123 --> 00:04:22,128 E aí, aqui nós temos o que nós queremos analisar, eu vou apertar o entre, 79 00:04:22,128 --> 00:04:25,231 vou imprimir e aí nós vamos interpretando, iremos interpretar junto. 80 00:04:25,264 --> 00:04:28,534 Tudo bem, para teste um de lá na hipótese legal. 81 00:04:28,601 --> 00:04:33,038 Que construção que é essa, Rafa, que vocês escutou e você ainda não ensinou? 82 00:04:33,305 --> 00:04:35,307 Vamos tentar entender o que está aqui. 83 00:04:35,307 --> 00:04:37,576 Vamos tentar? Não vamos entender, né? 84 00:04:37,576 --> 00:04:42,314 Teste anterior Hipótese é um nome de uma variável, aí sinal de menor assim. 85 00:04:42,448 --> 00:04:46,886 Então o que acontecer aqui será atribuído para dentro desse 86 00:04:46,986 --> 00:04:50,522 essa variável tender lá teste 87 00:04:50,589 --> 00:04:54,193 e mais um tema que vocês precisam aprender. 88 00:04:54,260 --> 00:04:56,195 O que seria isso? 89 00:04:56,195 --> 00:04:57,796 Oh, ele é usado. 90 00:04:57,796 --> 00:05:01,166 Ele é mais usado para comparar a média de dois grupos 91 00:05:01,267 --> 00:05:06,238 e determinar estatisticamente se há diferença entre eles. 92 00:05:06,338 --> 00:05:08,874 Então nós não temos duas bases de dados. 93 00:05:08,874 --> 00:05:14,179 Oh, vamos lembrar que a base de dados da análise da performance do sistema do antes 94 00:05:14,280 --> 00:05:18,917 e a análise dos dados com a base de dados do depois com a performance. 95 00:05:18,984 --> 00:05:19,752 Se você olhar 96 00:05:19,752 --> 00:05:22,988 1A1, se vai ver que está melhor mesmo. 97 00:05:23,122 --> 00:05:25,691 Mas vamos deixar para o R fazer isso para nós. 98 00:05:25,691 --> 00:05:28,027 Então nós temos que fornecer a base de dados, 99 00:05:28,027 --> 00:05:31,997 o conjunto de dados do antes e do depois. 100 00:05:32,064 --> 00:05:37,236 E aqui o que a gente faz é uma instrução para dizer que nós estamos 101 00:05:37,236 --> 00:05:41,373 fazendo uma comparação com essas duas, com duas bases de dados. 102 00:05:41,440 --> 00:05:44,576 Rafa Poderíamos fazer uma análise com mais base de dados? 103 00:05:44,777 --> 00:05:45,711 Sim, poderíamos. 104 00:05:45,711 --> 00:05:48,714 Aqui nós só estamos comparando duas. 105 00:05:48,814 --> 00:05:53,118 E aí você fala Nossa, Rafa, saiu um resultado aí um pouquinho extenso. 106 00:05:53,185 --> 00:05:55,120 Calma aí que nós iremos interpretar ele. 107 00:05:55,120 --> 00:05:58,123 Tudo bem? Vem aqui comigo, por favor. 108 00:05:58,123 --> 00:05:59,124 Então o que nós fizemos? 109 00:05:59,124 --> 00:06:01,427 Estamos indo interpretar aquele resultado 110 00:06:01,427 --> 00:06:05,697 que estão os comentários, os dados do antes e do depois. 111 00:06:05,798 --> 00:06:08,333 Uma primeira, 112 00:06:08,333 --> 00:06:11,670 primeira, o teste de hipótese que nós fizemos. 113 00:06:11,770 --> 00:06:14,506 E aqui nós vamos imprimir esse resultado do teste, hipótese 114 00:06:14,506 --> 00:06:16,175 que é o que a gente acabou de fazer. 115 00:06:16,175 --> 00:06:20,145 Vou deixar só comentado, mas vai se fazer a mesma saída, tá? 116 00:06:20,212 --> 00:06:21,914 Então 117 00:06:21,914 --> 00:06:24,049 o que nós temos aqui? 118 00:06:24,049 --> 00:06:25,651 Como que a gente pode interpretar? 119 00:06:25,651 --> 00:06:29,454 Você só mandou imprimir e colocou o título aqui, que é o resto entregue. 120 00:06:29,555 --> 00:06:34,793 E aí você tem que novamente focar na análise da saída dos dados. 121 00:06:34,893 --> 00:06:39,598 Tem esse p value aqui, que é um dos focos da nossa análise. 122 00:06:39,698 --> 00:06:42,668 Se vocês voltarem aqui para o começo, 123 00:06:42,868 --> 00:06:45,871 vocês podem tirar algumas análise 124 00:06:46,071 --> 00:06:49,942 do que a gente está buscando ou os intervalos de confiança. 125 00:06:49,942 --> 00:06:54,279 Usado para estimar a incerteza associada a uma estimativa pontual. 126 00:06:54,346 --> 00:06:59,451 O quanto a gente tem a certeza ou incerteza que isso está nos ajudando. 127 00:06:59,551 --> 00:07:02,554 Então, aqui nós conseguimos fazer com que a linguagem R 128 00:07:02,688 --> 00:07:06,458 fizesse essa análise do tempo, o antes e o depois, 129 00:07:06,525 --> 00:07:10,062 olhando antes da execução, nós conseguimos ter a certeza. 130 00:07:10,128 --> 00:07:13,198 Mas lembre se sempre no dia a dia do seu trabalho, 131 00:07:13,198 --> 00:07:16,201 na sua vida pessoal, você vai precisar analisar dados 132 00:07:16,401 --> 00:07:20,639 que geralmente esse conjunto de dados é muito maior. 133 00:07:20,739 --> 00:07:24,576 Então utilize o R para que faça essa análise por você. 134 00:07:24,643 --> 00:07:30,215 E agora fica uma dica pense em um cenário, algo da sua vida pessoal 135 00:07:30,215 --> 00:07:34,219 ou de algum familiar seu, ou até mesmo da sua empresa que você tem 136 00:07:34,219 --> 00:07:38,924 esse conjunto de dados do antes e o depois e você precisa fazer essa análise, 137 00:07:38,990 --> 00:07:41,993 de preferência um conjunto de dados até maior, 138 00:07:42,027 --> 00:07:45,697 e aí você tente executar esse script novamente, 139 00:07:45,764 --> 00:07:50,235 buscando essa análise nos comentários e você consiga chegar no seu resultado. 140 00:07:50,469 --> 00:07:53,305 Então você terá certeza que fazendo na prática 141 00:07:53,305 --> 00:07:56,741 você consegue absorver esse conhecimento e.