0:00:07.890,0:00:11.911 Uma das maneiras[br]de se aprender é na prática. 0:00:11.911,0:00:14.792 E agora nós temos um case para trazer aqui 0:00:14.792,0:00:20.120 onde nós iremos conseguir executar[br]a partir de hipóteses e intervalos. 0:00:20.120,0:00:21.354 Pense no cenário: 0:00:21.354,0:00:25.784 vocês têm um sistema que não [br]está performando muito bem, 0:00:25.784,0:00:30.536 e aí é feita uma análise, são [br]coletados os dados de hora em hora 0:00:30.536,0:00:33.466 para saber como está [br]a performance daquele sistema. 0:00:33.466,0:00:38.487 Então é estudado e verificado que existe[br]a possibilidade de se melhorar o algoritmo, 0:00:39.205,0:00:44.110 Essas melhorias do algoritmo [br]são implementadas, e, posteriormente, 0:00:44.110,0:00:48.548 são novamente coletados os dados[br]com relação à performance do sistema. 0:00:48.548,0:00:51.684 Então você tem o antes e o depois. 0:00:51.684,0:00:56.122 Se você tem o antes e o depois [br]dos dados, você pode comparar. 0:00:56.122,0:01:02.061 Se for um intervalo bem pequeno,[br]talvez você consiga comparar olhando. 0:01:02.061,0:01:04.888 Mas imagine numa situação [br]real em uma empresa, 0:01:04.888,0:01:09.493 onde um sistema fica processando [br]durante 24 horas durante um mês, 0:01:09.493,0:01:13.573 quantos dados você tem ali [br]para fazer essa comparação? 0:01:13.573,0:01:15.581 Então vamos fazer isso aqui na prática. 0:01:15.581,0:01:19.061 Eu deixei um script pré-pronto, [br]sempre daquela maneira, 0:01:19.061,0:01:21.481 deixando essa parte com a hashtag, 0:01:21.481,0:01:25.901 que é um resumo teórico [br]do que nós iremos analisar, 0:01:25.901,0:01:29.901 até mesmo algumas explicações [br]um pouco mais técnicas, 0:01:29.901,0:01:31.791 ou com a parte de estatística. 0:01:31.791,0:01:34.360 Então aqui nós temos duas bases de dados. 0:01:34.360,0:01:36.375 Se apertarmos um Enter,[br]isso vai ser executado. 0:01:36.375,0:01:38.865 Mas sempre gostamos de fazer na prática. 0:01:38.865,0:01:44.405 Vamos apertar o Enter aqui, e iremos [br]copiar essas duas bases de dados. 0:01:44.405,0:01:46.539 "Rafa, por que você traz pronto?" 0:01:46.539,0:01:50.243 Para não precisar criar agora[br]dois conjuntos de dados. 0:01:50.243,0:01:51.611 Eu vou limpar aqui. 0:01:51.611,0:01:53.610 Vamos interpretar o que nós temos, tá? 0:01:53.610,0:01:55.367 Olhe, esses são os dados para a análise. 0:01:55.367,0:01:57.617 Opa! Vou tirar esse sinalzinho aqui. 0:01:57.617,0:02:02.121 Então, antes da implementação [br]do algoritmo, 0:02:02.121,0:02:05.058 vamos supor que foi analisado. 0:02:05.058,0:02:09.915 Nós temos aqui a hora um,[br]hora dois, hora três, hora quatro, 0:02:09.915,0:02:14.133 hora cinco, hora seis,[br]hora sete, e hora oito. 0:02:14.133,0:02:17.036 Então, antes de implementar [br]essa melhoria no algoritmo, 0:02:17.036,0:02:19.705 esses eram os valores[br]dos tempos de execução. 0:02:19.705,0:02:21.607 Vamos supor em segundos? 0:02:21.607,0:02:27.246 E aí foi implementada a melhoria[br]e fizeram uma nova coleta de dados. 0:02:27.246,0:02:30.216 E aí, em segundos, quanto tempo demorou. 0:02:30.216,0:02:33.219 "Se você olhar aqui, Rafa,[br]não precisa nem processar. 0:02:33.219,0:02:36.697 Já fica visível que sim, está melhor." 0:02:36.697,0:02:38.908 Mas lembre-se que, no dia a dia, 0:02:38.908,0:02:41.417 você geralmente tem um conjunto [br]de dados muito maior. 0:02:41.417,0:02:46.999 Então, se você for fazer análise no papel, [br]você vai demorar muitas horas. 0:02:46.999,0:02:50.269 E aqui, o mesmo script[br]que nós vamos executar agora, 0:02:50.269,0:02:55.208 serve para um conjunto pequeno de dados[br]como esse ou para um conjunto muito maior. 0:02:55.208,0:02:56.747 Vamos ver como fica. 0:02:56.747,0:02:59.533 Então nós vamos apertar um Enter. 0:03:00.913,0:03:05.439 Não é obrigatório, mas é sempre [br]legal você visualizar os dados 0:03:05.439,0:03:07.720 para confirmar que está tudo certinho. 0:03:07.720,0:03:12.291 Criamos o tempo antes e pedimos [br]para mostrar o tempo antes. 0:03:12.291,0:03:14.296 Vamos apertar dois Enters aqui. 0:03:14.296,0:03:16.656 Print, e vamos mostrá-lo. 0:03:16.656,0:03:22.001 De novo, você pode digitar tempos_depois 0:03:22.001,0:03:25.899 ou você pode utilizar a sugestão dele,[br]olhe, para cima, e vou apertar o Enter. 0:03:26.872,0:03:31.838 Então nós criamos aqui o antes e o depois. 0:03:31.838,0:03:33.045 Legal! 0:03:33.045,0:03:34.915 Vamos subir um pouquinho. 0:03:34.915,0:03:37.495 Então novamente, aquela velha dica: 0:03:37.495,0:03:40.271 se tem alguma dúvida [br]das análises que iremos fazer, 0:03:40.271,0:03:41.987 fica um resumo aqui para vocês. 0:03:41.987,0:03:43.850 Pode pausar e anotar. 0:03:43.850,0:03:49.028 Aqui são os dois dados, os dois conjuntos[br]de dados, que acabamos de criar. 0:03:49.028,0:03:51.711 E agora nós vamos para uma próxima parte. 0:03:52.818,0:03:55.668 "Rafa, tem mais comentário [br]aí do que execução." 0:03:55.668,0:03:59.171 Sim, é sempre legal[br]vocês terem esse resumo. 0:03:59.171,0:04:01.640 Eu gosto de deixar um resumo para vocês. 0:04:01.640,0:04:05.945 Eu vou dar um Enter aqui[br]para a tela ficar um pouco limpa. 0:04:05.945,0:04:07.496 Deixe-me só arrumar aqui. 0:04:07.496,0:04:08.886 Só um minuto. 0:04:08.886,0:04:10.527 O que nós temos aqui? 0:04:13.014,0:04:17.123 A primeira aqui é o título, né,[br]"realizando o teste de hipóteses". 0:04:17.123,0:04:21.218 E aqui nós temos o que nós [br]queremos analisar. 0:04:21.218,0:04:25.634 Eu vou apertar o Enter e vou imprimir, [br]e aí nós vamos interpretar juntos, tudo bem? 0:04:25.634,0:04:27.374 "teste_hipotese". 0:04:28.601,0:04:33.305 "Que construção é essa, Rafa, que você[br]executou e ainda não ensinou?" 0:04:33.305,0:04:35.247 Vamos tentar entender o que está aqui. 0:04:35.247,0:04:36.096 Vamos tentar, não. 0:04:36.096,0:04:37.576 Vamos entender, né? 0:04:37.576,0:04:40.998 teste_hipotese" é [br]um nome de uma variável. 0:04:40.998,0:04:42.448 Aí sinal de menor, tracinho. 0:04:42.448,0:04:47.676 Então o que acontecer aqui será [br]atribuído para dentro dessa variável. 0:04:48.909,0:04:54.260 "t.test" é mais um tema [br]que vocês precisam aprender. 0:04:54.260,0:04:56.195 O que seria isso? 0:04:56.195,0:05:01.267 Ele é mais usado para comparar [br]a média de dois grupos 0:05:01.267,0:05:06.338 e determinar estatisticamente[br]se há diferença entre eles. 0:05:06.338,0:05:08.874 Então nós não temos duas bases de dados? 0:05:08.874,0:05:14.280 Vamos lembrar: base de dados da análise [br]da performance do sistema do antes 0:05:14.280,0:05:17.857 e a análise dos dados com a base de dados[br]do depois com a performance. 0:05:18.984,0:05:23.122 Se você olhar um a um, você [br]vai ver que está melhor mesmo. 0:05:23.122,0:05:25.691 Mas vamos deixar o R fazer isso para nós. 0:05:25.691,0:05:28.027 Então nós temos que fornecer [br]a base de dados, 0:05:28.027,0:05:32.064 o conjunto de dados do antes e do depois. 0:05:32.064,0:05:37.516 E aqui nós fazemos uma instrução [br]para dizer que nós estamos fazendo 0:05:37.516,0:05:41.440 uma comparação com duas bases de dados. 0:05:41.440,0:05:44.777 "Rafa, poderíamos fazer uma análise[br]com mais base de dados?" 0:05:44.777,0:05:45.711 Sim, poderíamos. 0:05:45.711,0:05:48.814 Aqui nós só estamos comparando duas. 0:05:48.814,0:05:53.185 E aí você fala: "Nossa, Rafa, saiu [br]um resultado um pouquinho extenso." 0:05:53.185,0:05:55.990 Calma aí que nós iremos [br]interpretá-lo, tudo bem? 0:05:55.990,0:05:57.953 Vem aqui comigo, por favor. 0:05:57.953,0:05:59.124 O que nós fizemos então? 0:05:59.124,0:06:01.427 Nós ainda precisamos [br]interpretar aquele resultado, né? 0:06:01.427,0:06:04.857 Aqui estão os comentários,[br]os dados do antes e do depois... 0:06:08.333,0:06:11.770 Um primeiro teste [br]de hipótese que nós fizemos, 0:06:11.770,0:06:14.506 e aqui nós vamos imprimir esse [br]resultado do teste de hipótese, 0:06:14.506,0:06:16.175 que é o que acabamos de fazer. 0:06:16.175,0:06:19.395 Vou deixar só comentado, mas [br]vai se fazer a mesma saída, tá? 0:06:21.914,0:06:24.049 O que nós temos aqui então? 0:06:24.049,0:06:25.651 "Como podemos interpretar, Rafa? 0:06:25.651,0:06:29.025 Você só mandou imprimir e colocou [br]um título aqui, que é a hashtag." 0:06:30.155,0:06:34.893 Aí você tem que novamente focar[br]na análise da saída dos dados. 0:06:34.893,0:06:39.698 Tem esse p-value aqui, que é [br]um dos focos da nossa análise. 0:06:39.698,0:06:42.868 Se vocês voltarem para o começo aqui, 0:06:42.868,0:06:48.281 vocês podem tirar algumas análises[br]do que estamos buscando, né? 0:06:48.281,0:06:50.102 Olhe: "Os intervalos [br]de confiança são usados 0:06:50.102,0:06:53.511 para estimar a incerteza associada [br]a uma estimativa pontual". 0:06:54.346,0:06:59.328 O quanto temos a certeza,[br]ou incerteza, que isso está nos ajudando. 0:06:59.328,0:07:02.688 Então nós conseguimos fazer[br]com que a linguagem R 0:07:02.688,0:07:06.525 fizesse essa análise do tempo[br]o antes e do depois. 0:07:06.525,0:07:10.128 Olhando antes da execução,[br]nós conseguimos ter a certeza. 0:07:10.128,0:07:13.198 Mas lembre-se sempre [br]no dia a dia do seu trabalho, 0:07:13.198,0:07:16.401 na sua vida pessoal, que você [br]vai precisar analisar dados 0:07:16.401,0:07:20.739 onde geralmente esse conjunto [br]de dados é muito maior. 0:07:20.739,0:07:24.643 Então utilize o R para que faça [br]essa análise por você. 0:07:24.643,0:07:27.405 E agora fica uma dica: [br]pense em um cenário, 0:07:27.405,0:07:33.469 algo da sua vida pessoal ou de algum [br]familiar seu, ou até mesmo da sua empresa, 0:07:33.469,0:07:37.100 onde você tenha esse conjunto [br]de dados do antes e do depois, 0:07:37.100,0:07:38.990 e você precisa fazer essa análise, 0:07:38.990,0:07:42.027 de preferência um conjunto [br]de dados até maior. 0:07:42.027,0:07:45.764 E aí tente executar esse script novamente 0:07:45.764,0:07:50.469 buscando essa análise dos comentários,[br]e tente chegar no seu resultado. 0:07:50.469,0:07:53.305 Então você terá certeza que, na prática, 0:07:53.305,0:07:56.288 você consegue absorver [br]esse conhecimento.