0:00:08.141,0:00:08.441 Uma das 0:00:08.441,0:00:11.811 maneiras de se aprender[br]é fazendo na prática. 0:00:11.911,0:00:15.482 E agora nós temos um case para trazer aqui[br]que nós iremos 0:00:15.482,0:00:20.053 conseguir executar[br]a partir de hipóteses e intervalos. 0:00:20.120,0:00:21.354 Pense no cenário. 0:00:21.354,0:00:24.924 Vocês têm um sistema que o sistema[br]não está performando 0:00:24.924,0:00:28.194 muito bem[br]e aí é feita uma análise e colete. 0:00:28.194,0:00:29.496 São coletados os dados 0:00:29.496,0:00:33.399 e de hora em hora, quanto[br]que está a performance daquele sistema? 0:00:33.466,0:00:39.139 Então é estudado e verificado que existe[br]a possibilidade de se melhorar o algoritmo 0:00:39.205,0:00:44.110 e implementar essas melhorias do algoritmo[br]e posteriormente 0:00:44.110,0:00:48.481 são coletados novamente os dados[br]com relação à performance do sistema. 0:00:48.548,0:00:51.551 Então você tem o antes e o depois. 0:00:51.684,0:00:56.055 Se você tem o antes e o depois dos dados,[br]você pode comparar. 0:00:56.122,0:00:58.658 Se for um intervalo bem pequeno,[br]talvez você 0:00:58.658,0:01:01.995 consiga no seu papel ali olhando comparar. 0:01:02.061,0:01:05.398 Mas imagine uma situação real[br]em uma empresa que um sistema 0:01:05.398,0:01:09.469 fica processando durante 24 horas[br]durante um mês. 0:01:09.535,0:01:10.103 Quanto? 0:01:10.103,0:01:13.506 Quanto os dados[br]você tem ali para fazer essa comparação? 0:01:13.573,0:01:17.777 Então vamos fazer isso aqui na prática,[br]deixar o script pré pronto, 0:01:17.877,0:01:21.314 sempre daquela maneira,[br]deixando essa parte com a hashtag, 0:01:21.481,0:01:24.751 que é um resumo teórico do que nós 0:01:24.751,0:01:28.488 iremos analisar,[br]até mesmo algumas explicações 0:01:28.588,0:01:31.591 um pouco mais técnica[br]ou com a parte de estatística. 0:01:31.791,0:01:34.360 Então, aqui nós temos duas bases de dados. 0:01:34.360,0:01:35.395 Se você apertar um entre, 0:01:35.395,0:01:38.798 isso vai ser executado, mas a gente[br]sempre gosta de fazer na prática. 0:01:38.865,0:01:42.068 Vamos apertar Ao entrar aqui, 0:01:42.135,0:01:46.439 nós iremos copiar essas duas[br]bases de dados, porque se traz pronto. 0:01:46.539,0:01:48.307 Não precisa criar agora duas. 0:01:48.307,0:01:50.243 Dois conjuntos de dados. 0:01:50.243,0:01:51.611 Ou vou limpar aqui. 0:01:51.611,0:01:53.980 Vamos interpretar o que nós temos 0:01:53.980,0:01:57.550 são os dados para análise,[br]ou pode tirar isso daqui, o sinalzinho. 0:01:57.617,0:02:02.055 Então nós temos aqui[br]antes da implementação do algoritmo. 0:02:02.121,0:02:05.058 Vamos supor que nós for[br]o que foi analisado. 0:02:05.058,0:02:09.195 Nós temos aqui um,[br]ora um, ora dois, ora três, 0:02:09.195,0:02:14.033 ora quatro, ora 05h00, 06h07 e hora oito. 0:02:14.133,0:02:17.036 Então, antes de implementar essa melhoria[br]no algoritmo, 0:02:17.036,0:02:19.705 esses são os valores[br]dos tempo de execução. 0:02:19.705,0:02:21.607 Vamos supor em segundos. 0:02:21.607,0:02:23.543 E aí foi implementado a melhoria. 0:02:23.543,0:02:27.146 E aí fez uma nova,[br]Fizeram uma nova coleta de dados. 0:02:27.246,0:02:30.216 E aí, em segundos, quanto tempo demorou? 0:02:30.216,0:02:33.219 Se você olhar aqui, Rafa,[br]não precisa nem processar. 0:02:33.286,0:02:36.756 Já fica visível que sim, está melhor. 0:02:36.823,0:02:37.390 Mas lembre se 0:02:37.390,0:02:41.194 que no dia a dia, geralmente[br]você tem um conjunto de dados muito maior. 0:02:41.427,0:02:46.933 Então você, se você for fazer análise[br]no papel, você vai demorar muitas horas. 0:02:46.999,0:02:50.203 E aqui o mesmo script[br]que nós vamos executar agora 0:02:50.269,0:02:55.141 serve para um conjunto pequeno de dados[br]como esse ou como um conjunto muito maior. 0:02:55.208,0:02:56.809 Vamos ver como é que fica. 0:02:56.809,0:03:00.913 Então nós vamos apertar enter aqui[br]e sempre. 0:03:00.980,0:03:03.449 Não é obrigatório, mas é sempre legal 0:03:03.449,0:03:07.620 você visualizar os dados[br]para confirmar que está tudo certinho. 0:03:07.720,0:03:12.224 Criamos o tempo antes[br]e pedimos para mostrar o tempo antes. 0:03:12.291,0:03:16.996 Vamos apertar 2 a 3 aqui, gente,[br]vamos mostrar ele de novo. 0:03:16.996,0:03:21.934 Você pode digitar tempos depois 0:03:22.001,0:03:26.806 ou você pode utilizar a sugestão dele[br]para cima ou apertar enter. 0:03:26.872,0:03:30.109 Então nós criamos aqui 0:03:30.209,0:03:32.678 o antes e o depois. 0:03:32.678,0:03:33.045 Legal! 0:03:33.045,0:03:35.915 Vamos subir um pouquinho[br]então, aqui novamente 0:03:35.915,0:03:38.951 naquela velha dica[br]se tem alguma dúvida das análises 0:03:38.951,0:03:41.987 que iremos fazer, fica um resumo[br]aqui para vocês. 0:03:41.987,0:03:44.390 Pode pausar e anotar aqui. 0:03:44.390,0:03:48.928 São os dois dados, os dois conjuntos[br]de dados que acabamos de criar. 0:03:49.028,0:03:51.931 E agora nós vamos para uma próxima parte. 0:03:51.931,0:03:55.434 Deixa eu pegar, Rafa,[br]tem mais comentário aí do que execução. 0:03:55.668,0:03:59.071 Sim, é sempre legal[br]vocês terem esse resumo. 0:03:59.171,0:04:01.640 Eu gosto deixar um resumo para vocês. 0:04:01.640,0:04:05.745 Vou dar um repertório entra aqui, tela[br]fica um pouco limpo, 0:04:05.945,0:04:10.216 deixa eu só arrumar aqui[br]só um minuto que nós temos aqui. 0:04:10.216,0:04:11.984 Rafa. 0:04:11.984,0:04:13.686 Porque voltando a primeira 0:04:13.686,0:04:17.056 que é o título,[br]realizando o teste de hipóteses. 0:04:17.123,0:04:22.128 E aí, aqui nós temos o que nós queremos[br]analisar, eu vou apertar o entre, 0:04:22.128,0:04:25.231 vou imprimir e aí nós vamos interpretando,[br]iremos interpretar junto. 0:04:25.264,0:04:28.534 Tudo bem,[br]para teste um de lá na hipótese legal. 0:04:28.601,0:04:33.038 Que construção que é essa, Rafa, que vocês[br]escutou e você ainda não ensinou? 0:04:33.305,0:04:35.307 Vamos tentar entender o que está aqui. 0:04:35.307,0:04:37.576 Vamos tentar? Não vamos entender, né? 0:04:37.576,0:04:42.314 Teste anterior Hipótese é um nome[br]de uma variável, aí sinal de menor assim. 0:04:42.448,0:04:46.886 Então o que acontecer aqui[br]será atribuído para dentro desse 0:04:46.986,0:04:50.522 essa variável tender lá teste 0:04:50.589,0:04:54.193 e mais um tema que vocês precisam[br]aprender. 0:04:54.260,0:04:56.195 O que seria isso? 0:04:56.195,0:04:57.796 Oh, ele é usado. 0:04:57.796,0:05:01.166 Ele é mais usado[br]para comparar a média de dois grupos 0:05:01.267,0:05:06.238 e determinar estatisticamente[br]se há diferença entre eles. 0:05:06.338,0:05:08.874 Então nós não temos duas bases de dados. 0:05:08.874,0:05:14.179 Oh, vamos lembrar que a base de dados da[br]análise da performance do sistema do antes 0:05:14.280,0:05:18.917 e a análise dos dados com a base de dados[br]do depois com a performance. 0:05:18.984,0:05:19.752 Se você olhar 0:05:19.752,0:05:22.988 1A1, se vai ver que está melhor mesmo. 0:05:23.122,0:05:25.691 Mas vamos deixar para o R fazer isso[br]para nós. 0:05:25.691,0:05:28.027 Então[br]nós temos que fornecer a base de dados, 0:05:28.027,0:05:31.997 o conjunto de dados do antes e do depois. 0:05:32.064,0:05:37.236 E aqui o que a gente faz[br]é uma instrução para dizer que nós estamos 0:05:37.236,0:05:41.373 fazendo uma comparação com essas duas,[br]com duas bases de dados. 0:05:41.440,0:05:44.576 Rafa Poderíamos fazer uma análise[br]com mais base de dados? 0:05:44.777,0:05:45.711 Sim, poderíamos. 0:05:45.711,0:05:48.714 Aqui nós só estamos comparando duas. 0:05:48.814,0:05:53.118 E aí você fala Nossa, Rafa,[br]saiu um resultado aí um pouquinho extenso. 0:05:53.185,0:05:55.120 Calma aí que nós iremos interpretar ele. 0:05:55.120,0:05:58.123 Tudo bem? Vem aqui comigo, por favor. 0:05:58.123,0:05:59.124 Então o que nós fizemos? 0:05:59.124,0:06:01.427 Estamos indo interpretar aquele resultado 0:06:01.427,0:06:05.697 que estão os comentários,[br]os dados do antes e do depois. 0:06:05.798,0:06:08.333 Uma primeira, 0:06:08.333,0:06:11.670 primeira,[br]o teste de hipótese que nós fizemos. 0:06:11.770,0:06:14.506 E aqui nós vamos imprimir esse resultado[br]do teste, hipótese 0:06:14.506,0:06:16.175 que é o que a gente acabou de fazer. 0:06:16.175,0:06:20.145 Vou deixar só comentado,[br]mas vai se fazer a mesma saída, tá? 0:06:20.212,0:06:21.914 Então 0:06:21.914,0:06:24.049 o que nós temos aqui? 0:06:24.049,0:06:25.651 Como que a gente pode interpretar? 0:06:25.651,0:06:29.454 Você só mandou imprimir e colocou o título[br]aqui, que é o resto entregue. 0:06:29.555,0:06:34.793 E aí você tem que novamente focar[br]na análise da saída dos dados. 0:06:34.893,0:06:39.598 Tem esse p value aqui,[br]que é um dos focos da nossa análise. 0:06:39.698,0:06:42.668 Se vocês voltarem aqui para o começo, 0:06:42.868,0:06:45.871 vocês podem tirar algumas análise 0:06:46.071,0:06:49.942 do que a gente está buscando[br]ou os intervalos de confiança. 0:06:49.942,0:06:54.279 Usado para estimar a incerteza associada[br]a uma estimativa pontual. 0:06:54.346,0:06:59.451 O quanto a gente tem a certeza[br]ou incerteza que isso está nos ajudando. 0:06:59.551,0:07:02.554 Então, aqui nós conseguimos fazer[br]com que a linguagem R 0:07:02.688,0:07:06.458 fizesse essa análise do tempo,[br]o antes e o depois, 0:07:06.525,0:07:10.062 olhando antes da execução,[br]nós conseguimos ter a certeza. 0:07:10.128,0:07:13.198 Mas lembre se sempre no dia[br]a dia do seu trabalho, 0:07:13.198,0:07:16.201 na sua vida pessoal,[br]você vai precisar analisar dados 0:07:16.401,0:07:20.639 que geralmente esse conjunto de dados[br]é muito maior. 0:07:20.739,0:07:24.576 Então utilize o R[br]para que faça essa análise por você. 0:07:24.643,0:07:30.215 E agora fica uma dica pense em um cenário,[br]algo da sua vida pessoal 0:07:30.215,0:07:34.219 ou de algum familiar seu,[br]ou até mesmo da sua empresa que você tem 0:07:34.219,0:07:38.924 esse conjunto de dados do antes e o depois[br]e você precisa fazer essa análise, 0:07:38.990,0:07:41.993 de preferência[br]um conjunto de dados até maior, 0:07:42.027,0:07:45.697 e aí você tente executar esse[br]script novamente, 0:07:45.764,0:07:50.235 buscando essa análise nos comentários[br]e você consiga chegar no seu resultado. 0:07:50.469,0:07:53.305 Então você[br]terá certeza que fazendo na prática 0:07:53.305,0:07:56.741 você consegue[br]absorver esse conhecimento e.