0:00:08.141,0:00:08.441 Uma das maneiras [br]de se aprender é na prática. 0:00:11.911,0:00:15.482 E agora nós temos um case para trazer aqui 0:00:15.482,0:00:20.053 onde nós iremos conseguir executar[br]a partir de hipóteses e intervalos. 0:00:20.120,0:00:21.354 Pense no cenário: 0:00:21.354,0:00:24.924 vocês têm um sistema que [br]não está performando muito bem, 0:00:24.924,0:00:28.194 e aí é feita uma análise e coleta. 0:00:28.194,0:00:29.496 São coletados os dados de hora em hora, 0:00:29.496,0:00:33.399 para saber como está [br]a performance daquele sistema. 0:00:33.466,0:00:39.139 Então é estudado e verificado que existe[br]a possibilidade de se melhorar o algoritmo, 0:00:39.205,0:00:44.110 implementar essas melhorias [br]do algoritmo, e, posteriormente, 0:00:44.110,0:00:48.481 são coletados novamente os dados[br]com relação à performance do sistema. 0:00:48.548,0:00:51.551 Então você tem o antes e o depois. 0:00:51.684,0:00:56.055 Se você tem o antes e o depois [br]dos dados, você pode comparar. 0:00:56.122,0:00:58.658 Se for um intervalo bem pequeno,[br]talvez você consiga comparar olhando. 0:01:02.061,0:01:05.398 Mas imagine uma situação [br]real em uma empresa 0:01:05.398,0:01:09.469 onde um sistema fica processando [br]durante 24 horas durante um mês. 0:01:10.103,0:01:13.506 Quantos dados você tem ali [br]para fazer essa comparação? 0:01:13.573,0:01:17.777 Então vamos fazer isso aqui na prática,[br]deixar o script pré-pronto, 0:01:17.877,0:01:21.314 sempre daquela maneira,[br]deixando essa parte com a hashtag, 0:01:21.481,0:01:24.751 que é um resumo teórico [br]do que nós iremos analisar, 0:01:24.751,0:01:28.488 até mesmo algumas explicações um pouco [br]mais técnicas, ou com a parte de estatística. 0:01:31.791,0:01:34.360 Então, aqui nós temos duas bases de dados. 0:01:34.360,0:01:35.395 Se você apertar um Enter,[br]isso vai ser executado. 0:01:35.395,0:01:38.798 Mas sempre gostamos de fazer na prática. 0:01:38.865,0:01:42.068 Vamos apertar Ao entrar aqui, 0:01:42.135,0:01:46.439 iremos copiar essas duas[br]bases de dados, porque se traz pronto. 0:01:46.539,0:01:48.307 Não precisa criar agora[br]dois conjuntos de dados. 0:01:50.243,0:01:51.611 Eu vou limpar aqui. 0:01:51.611,0:01:53.980 Vamos interpretar o que nós temos 0:01:53.980,0:01:57.550 são os dados para análise,[br]ou pode tirar isso daqui, o sinalzinho. 0:01:57.617,0:02:02.055 Então nós temos aqui[br]antes da implementação do algoritmo. 0:02:02.121,0:02:05.058 Vamos supor que nós for[br]o que foi analisado. 0:02:05.058,0:02:09.195 Nós temos aqui hora um,[br]hora um, hora dois, hora três, 0:02:09.195,0:02:14.033 hora quatro, hora cinco, [br]hora seis, hora sete, e hora oito. 0:02:14.133,0:02:17.036 Então, antes de implementar [br]essa melhoria no algoritmo, 0:02:17.036,0:02:19.705 esses são os valores[br]dos tempo de execução. 0:02:19.705,0:02:21.607 Vamos supor que em segundos. 0:02:21.607,0:02:23.543 E aí foi implementada a melhoria. 0:02:23.543,0:02:27.146 E aí fizeram uma nova coleta de dados. 0:02:27.246,0:02:30.216 Em segundos, quanto tempo demorou? 0:02:30.216,0:02:33.219 "Se você olhar aqui, Rafa,[br]não precisa nem processar. 0:02:33.286,0:02:36.756 Já fica visível que sim, está melhor." 0:02:36.823,0:02:37.390 Mas lembre-se que, no dia a dia, 0:02:38.908,0:02:39.908 você geralmente tem um conjunto [br]de dados muito maior. 0:02:41.427,0:02:46.933 Então, se você for fazer análise no papel, [br]você vai demorar muitas horas. 0:02:46.999,0:02:50.203 E aqui, o mesmo script[br]que nós vamos executar agora, 0:02:50.269,0:02:55.141 serve para um conjunto pequeno de dados[br]como esse ou para um conjunto muito maior. 0:02:55.208,0:02:56.809 Vamos ver como fica. 0:02:56.809,0:03:00.913 Então nós vamos apertar [br]Enter aqui, como sempre. 0:03:00.980,0:03:03.449 Não é obrigatório, mas é sempre [br]legal você visualizar os dados 0:03:03.449,0:03:07.620 para confirmar que está tudo certinho. 0:03:07.720,0:03:12.224 Criamos o tempo antes e pedimos [br]para mostrar o tempo antes. 0:03:12.291,0:03:16.996 Vamos apertar 2 a 3 aqui, gente,[br]vamos mostrá-lo de novo. 0:03:16.996,0:03:21.934 Você pode digitar tempos_depois 0:03:22.001,0:03:26.806 ou você pode utilizar a sugestão dele[br]para cima, ou apertar Enter. 0:03:26.872,0:03:30.109 Então nós criamos aqui o antes e o depois. 0:03:32.678,0:03:33.045 Legal! 0:03:33.045,0:03:35.915 Vamos subir um pouquinho[br]então novamente aqui. 0:03:35.915,0:03:38.951 Aquela velha dica: se tem alguma [br]dúvida das análises que iremos fazer, 0:03:38.951,0:03:41.987 fica um resumo aqui para vocês. 0:03:41.987,0:03:44.390 Pode pausar e anotar aqui. 0:03:44.390,0:03:48.928 São os dois dados, os dois conjuntos[br]de dados, que acabamos de criar. 0:03:49.028,0:03:51.931 E agora nós vamos para uma próxima parte. 0:03:51.931,0:03:54.668 "Deixe-me pegar, Rafa. 0:03:54.668,0:03:55.668 Tem mais comentário aí do que execução. 0:03:55.668,0:03:59.071 Sim, é sempre legal[br]vocês terem esse resumo. 0:03:59.171,0:04:01.640 Eu gosto de deixar um resumo para vocês. 0:04:01.640,0:04:05.745 Eu vou dar um Enter aqui[br]para a tela ficar um pouco limpa. 0:04:05.945,0:04:10.216 Deixe-me só arrumar aqui[br]só um minuto que nós temos aqui. 0:04:10.216,0:04:11.984 Rafa. 0:04:11.984,0:04:13.686 Porque voltando a primeira, que é o título,[br]realizando o teste de hipóteses. 0:04:17.123,0:04:22.128 E aí, aqui nós temos [br]o que nós queremos analisar. 0:04:22.128,0:04:25.231 Eu vou apertar o Enter, vou imprimir, [br]e aí nós vamos interpretar juntos, tudo bem? 0:04:25.264,0:04:28.534 Para teste um de lá na hipótese legal. 0:04:28.601,0:04:33.038 Que construção é essa, Rafa, que vocês[br]escutou e você ainda não ensinou? 0:04:33.305,0:04:35.307 Vamos tentar entender o que está aqui. 0:04:35.307,0:04:37.576 Vamos tentar? Não vamos entender, né? 0:04:37.576,0:04:42.314 Teste anterior Hipótese é um nome[br]de uma variável, aí sinal de menor assim. 0:04:42.448,0:04:46.886 Então o que acontecer aqui[br]será atribuído para dentro desse 0:04:46.986,0:04:50.522 essa variável tender lá teste. 0:04:50.589,0:04:54.193 É mais um tema que vocês [br]precisam aprender. 0:04:54.260,0:04:56.195 O que seria isso? 0:04:56.195,0:04:57.796 Oh, ele é usado. 0:04:57.796,0:05:01.166 Ele é mais usado para comparar [br]a média de dois grupos 0:05:01.267,0:05:06.238 e determinar estatisticamente[br]se há diferença entre eles. 0:05:06.338,0:05:08.874 Então nós não temos duas bases de dados. 0:05:08.874,0:05:14.179 Vamos lembrar que é a base de dados [br]da análise da performance do sistema do antes 0:05:14.280,0:05:18.917 e a análise dos dados com a base de dados[br]do depois com a performance. 0:05:18.984,0:05:19.752 Se você olhar um a um, você [br]vai ver que está melhor mesmo. 0:05:23.122,0:05:25.691 Mas vamos deixar o R fazer isso para nós. 0:05:25.691,0:05:28.027 Então nós temos que fornecer [br]a base de dados, 0:05:28.027,0:05:31.997 o conjunto de dados do antes e do depois. 0:05:32.064,0:05:37.236 E aqui nós fazemos uma instrução [br]para dizer que nós estamos fazendo 0:05:37.236,0:05:41.373 uma comparação com duas bases de dados. 0:05:41.440,0:05:44.576 "Rafa, poderíamos fazer uma análise[br]com mais base de dados?" 0:05:44.777,0:05:45.711 Sim, poderíamos. 0:05:45.711,0:05:48.714 Aqui nós só estamos comparando duas. 0:05:48.814,0:05:53.118 E aí você fala: "Nossa, Rafa, saiu [br]um resultado um pouquinho extenso." 0:05:53.185,0:05:55.120 Calma aí que nós iremos [br]interpretá-lo, tudo bem? 0:05:55.120,0:05:58.123 Vem aqui comigo, por favor. 0:05:58.123,0:05:59.124 O que nós fizemos então? 0:05:59.124,0:06:01.427 Estamos indo interpretar aquele [br]resultado onde estão os comentários, 0:06:01.427,0:06:05.697 os dados do antes e do depois, 0:06:08.333,0:06:11.670 um primeiro teste [br]de hipótese que nós fizemos. 0:06:11.770,0:06:14.506 E aqui nós vamos imprimir esse [br]resultado do teste de hipótese, 0:06:14.506,0:06:16.175 que é o que acabamos de fazer. 0:06:16.175,0:06:20.145 Vou deixar só comentado, mas [br]vai se fazer a mesma saída, tá? 0:06:21.914,0:06:24.049 O que nós temos aqui então? 0:06:24.049,0:06:25.651 Como podemos interpretar? 0:06:25.651,0:06:29.454 "Você só mandou imprimir e colocou [br]o título aqui, que é o resto entregue." 0:06:29.555,0:06:34.793 E aí você tem que novamente focar[br]na análise da saída dos dados. 0:06:34.893,0:06:39.598 Tem esse p-value aqui, que é [br]um dos focos da nossa análise. 0:06:39.698,0:06:42.668 Se vocês voltarem para o começo aqui, 0:06:42.868,0:06:45.871 vocês podem tirar algumas análises[br]do que estamos buscando, 0:06:46.071,0:06:49.942 os intervalos de confiança, 0:06:49.942,0:06:54.279 usados para estimar a incerteza [br]associada à uma estimativa pontual. 0:06:54.346,0:06:59.451 O quanto temos a certeza,[br]ou incerteza, que isso está nos ajudando. 0:06:59.551,0:07:02.554 Então nós conseguimos fazer[br]com que a linguagem R 0:07:02.688,0:07:06.458 fizesse essa análise do tempo,[br]o antes e o depois. 0:07:06.525,0:07:10.062 Olhando antes da execução,[br]nós conseguimos ter a certeza. 0:07:10.128,0:07:13.198 Mas lembre-se sempre [br]no dia a dia do seu trabalho, 0:07:13.198,0:07:16.201 na sua vida pessoal, que você [br]vai precisar analisar dados 0:07:16.401,0:07:20.639 onde geralmente esse conjunto [br]de dados é muito maior. 0:07:20.739,0:07:24.576 Então utilize o R para que faça [br]essa análise por você. 0:07:24.643,0:07:30.215 E agora fica uma dica: [br]pense em um cenário, 0:07:30.215,0:07:34.219 algo da sua vida pessoal ou de algum [br]familiar seu, ou até mesmo da sua empresa, 0:07:34.219,0:07:37.990 que você tem esse conjunto [br]de dados do antes e o depois, 0:07:37.990,0:07:38.990 e você precisa fazer essa análise, 0:07:38.990,0:07:41.993 de preferência[br]um conjunto de dados até maior, 0:07:42.027,0:07:45.697 e aí tente executar esse script novamente, 0:07:45.764,0:07:50.235 buscando essa análise nos comentários,[br]e tente chegar no seu resultado. 0:07:50.469,0:07:53.305 Então você terá certeza que, na prática, 0:07:53.305,0:07:56.741 você consegue absorver [br]esse conhecimento.