1 00:00:08,074 --> 00:00:11,211 Com certeza na sua vida pessoal ou profissional 2 00:00:11,211 --> 00:00:15,949 você já se deparou com uma situação que você tem que verificar a performance 3 00:00:15,949 --> 00:00:20,754 do antes e o depois de algo, como por exemplo, no computador da sua casa. 4 00:00:20,754 --> 00:00:23,823 Supondo que você vai aumentar a memória RAM, 5 00:00:23,823 --> 00:00:29,095 e ele está demorando cinco minutos para iniciar, e aí você coloca memória RAM, 6 00:00:29,095 --> 00:00:32,966 depois você quer verificar o quanto melhorou, ou se melhorou, 7 00:00:32,966 --> 00:00:35,935 então você está fazendo uma análise do antes e o depois. 8 00:00:35,935 --> 00:00:40,406 E a nossa linguagem R também nos ajuda a fazer a análise do antes e o depois. 9 00:00:40,406 --> 00:00:45,645 Só que, nesse caso, nós precisamos ter dados que consigam fazer essa comparação. 10 00:00:45,645 --> 00:00:48,015 Vamos trazer aqui um exemplo para vocês. 11 00:00:48,015 --> 00:00:51,985 Nesse exemplo, pense num caso real da fábrica de software. 12 00:00:51,985 --> 00:00:55,989 Nós temos lá um sistema funcionando que vai para a produção 13 00:00:55,989 --> 00:00:58,992 e aí descobrimos que a performance dele não está muito boa. 14 00:00:58,992 --> 00:01:03,363 Fizeram uma medição hora a hora nessa nossa performance. 15 00:01:03,363 --> 00:01:07,700 Então, após essa análise de uma performance não tão boa, 16 00:01:07,700 --> 00:01:12,171 melhorar o algoritmo, que é a lógica que está dentro do sistema, 17 00:01:12,171 --> 00:01:14,857 e, após, fazer uma nova medição. 18 00:01:14,857 --> 00:01:16,242 É isso que vamos ver agora, 19 00:01:16,242 --> 00:01:19,383 vamos fazer uma análise descritiva do antes e depois 20 00:01:19,383 --> 00:01:22,530 para vocês terem a confiança dos dados que estão sendo analisados, 21 00:01:22,530 --> 00:01:24,250 e até mesmo o seu resultado. 22 00:01:24,250 --> 00:01:25,957 Vem comigo que eu vou mostrar para vocês. 23 00:01:25,957 --> 00:01:31,924 Como sempre, eu deixo um script pronto, não somente as linhas de execução, 24 00:01:31,924 --> 00:01:36,462 o código do que precisamos fazer, mas também um comentário. 25 00:01:36,462 --> 00:01:40,366 Um breve resumo da análise descritiva está aqui no começo. 26 00:01:40,366 --> 00:01:45,271 Depois, se você quiser fazer uma pausa, ler e interpretar 27 00:01:45,271 --> 00:01:49,208 sobre o que é uma análise descritiva, aqui fica um breve resumo. 28 00:01:49,208 --> 00:01:52,639 Então, como nós falamos, nós precisamos de uma base de dados 29 00:01:52,639 --> 00:01:54,480 para poder analisar isso. 30 00:01:54,480 --> 00:01:57,683 Vamos rodar essas duas linhas aqui, criar os nossos dados 31 00:01:57,683 --> 00:02:00,858 para ter esse comparativo do antes e o depois. 32 00:02:02,055 --> 00:02:03,601 Se pegar aqui... 33 00:02:03,601 --> 00:02:05,481 Perdão. Vamos dar uns Enters aqui. 34 00:02:05,481 --> 00:02:08,961 Sempre apertamos alguns Enters para ficar uma área limpa aqui. 35 00:02:08,961 --> 00:02:12,865 Então nós estamos criando aqui um comentário, uma hashtag. 36 00:02:12,865 --> 00:02:17,637 O tempo antes da performance: hora um, hora dois, hora três. 37 00:02:17,637 --> 00:02:21,507 Aqui nós temos quatro, cinco, seis, sete, oito. 38 00:02:21,507 --> 00:02:24,410 É uma análise do antes e o depois 39 00:02:24,410 --> 00:02:28,147 em oito horas de execução de um código, por exemplo. 40 00:02:28,147 --> 00:02:30,616 Antes de implementar a melhoria no algoritmo, 41 00:02:30,616 --> 00:02:34,419 e depois de implementar a melhoria no algoritmo. 42 00:02:34,419 --> 00:02:36,329 Vamos apertar o Enter. 43 00:02:36,329 --> 00:02:39,831 E aí, como sempre, é legal visualizar como estão os dados. 44 00:02:39,831 --> 00:02:43,162 Olhe, tempo antes... Aperte o Enter. 45 00:02:43,162 --> 00:02:44,826 Opa, o que eu errei aqui? 46 00:02:44,826 --> 00:02:45,956 Print... 47 00:02:45,956 --> 00:02:48,087 Ah, "tempos", está vendo? 48 00:02:48,087 --> 00:02:49,577 O que eu errei? 49 00:02:49,577 --> 00:02:51,037 "tempo antes"... 50 00:02:51,037 --> 00:02:52,905 Agora vai funcionar. 51 00:02:52,905 --> 00:02:54,488 Aqui tem a letra "s". 52 00:02:54,488 --> 00:02:55,608 São tempos, né? 53 00:02:55,608 --> 00:02:59,053 Eu não tinha colocado o "s", então ele falou: "Opa!, Not found". 54 00:02:59,053 --> 00:03:00,813 Not found quer dizer que não existe. 55 00:03:00,813 --> 00:03:02,682 Ai depois eu coloquei certo. 56 00:03:02,682 --> 00:03:06,400 Então sigam aquela velha dica, né, ou vocês colocam aqui print, 57 00:03:06,400 --> 00:03:11,991 vocês copiam o nome da variável e colocam aqui no conjunto de dados, 58 00:03:11,991 --> 00:03:16,562 ou você digita, e ele dá a sugestão do nome. 59 00:03:16,562 --> 00:03:18,197 Aqui, no caso, ele deu a sugestão. 60 00:03:18,197 --> 00:03:20,800 A sugestão está correta, eu vou apertar. 61 00:03:20,800 --> 00:03:25,471 Então temos a análise do antes e o depois. 62 00:03:25,471 --> 00:03:29,008 Facilitando a interpretação aqui, se formos verificar, 63 00:03:29,008 --> 00:03:32,614 como sempre temos um conjunto de valores bem pequeno 64 00:03:32,614 --> 00:03:35,105 para facilitar a nossa análise. 65 00:03:36,182 --> 00:03:40,953 Olhando, nós já podemos fazer esse resultado prévio sem o R. 66 00:03:40,953 --> 00:03:44,239 O antes e o depois, o depois ficou melhor. 67 00:03:44,239 --> 00:03:46,859 Então implementou-se a melhoria no algoritmo 68 00:03:46,859 --> 00:03:50,529 e houve realmente uma melhor performance no sistema. 69 00:03:50,529 --> 00:03:56,168 Inclusive, olhando em todas as horas de execução, realmente está melhor. 70 00:03:56,168 --> 00:03:58,239 Eu, olhando, consigo. 71 00:03:58,239 --> 00:04:02,318 Mas se fosse uma análise com 300 horas de execução, 72 00:04:02,318 --> 00:04:05,578 iria ficar bem difícil vocês conseguirem olhando. 73 00:04:05,578 --> 00:04:09,456 Então vamos pedir para o R fazer para nós. 74 00:04:09,456 --> 00:04:10,282 O que vamos fazer? 75 00:04:10,282 --> 00:04:11,650 Vamos para a próxima parte. 76 00:04:11,650 --> 00:04:14,787 Então criamos o antes e o depois, 77 00:04:14,787 --> 00:04:17,316 Vamos apertar mais alguns Enters aqui. 78 00:04:17,316 --> 00:04:20,059 É sempre legal para facilitar a nossa área. 79 00:04:20,059 --> 00:04:22,862 Vamos para uma próxima parte. 80 00:04:22,862 --> 00:04:25,698 Nós vamos agora gerar todo o cenário 81 00:04:25,698 --> 00:04:30,536 para calcular as medidas descritivas para o antes. 82 00:04:30,536 --> 00:04:35,207 Então nós vamos fazer primeiro uma análise do antes, preparar esses dados do antes. 83 00:04:35,207 --> 00:04:40,179 Aqui nós vamos calcular a média simples do antes, 84 00:04:40,179 --> 00:04:43,983 e vamos calcular a mediana do antes. 85 00:04:43,983 --> 00:04:45,149 Vamos aqui? 86 00:04:45,149 --> 00:04:48,888 Eu vou apertar o Enter, vou apertar print. 87 00:04:48,888 --> 00:04:50,573 Olhe, média... 88 00:04:50,573 --> 00:04:55,364 Aí aqui, aquela velha história, ou você copia "media_antes", 89 00:04:55,364 --> 00:04:58,464 ou você deixa ele fazer a sugestão para você. 90 00:04:58,464 --> 00:05:00,099 Então essa é a média. 91 00:05:00,099 --> 00:05:04,870 Se somar todos esses valores, são quatro, cinco, seis, oito valores. 92 00:05:04,870 --> 00:05:06,405 São oito horas de análise. 93 00:05:06,405 --> 00:05:09,675 Somo e divido por oito, vai ser a média. 94 00:05:09,675 --> 00:05:14,474 Além de calcular a média que acabamos de visualizar, 95 00:05:14,474 --> 00:05:16,615 nós também pedimos para calcular a mediana. 96 00:05:16,615 --> 00:05:18,862 Vamos visualizar o valor da mediana? 97 00:05:20,252 --> 00:05:23,922 "Ô, Rafa, estamos tendo que utilizar os conceitos que aprendemos anteriormente." 98 00:05:23,922 --> 00:05:25,357 Sim. Isso é bom, né? 99 00:05:25,357 --> 00:05:27,669 As coisas vão se juntando. 100 00:05:27,669 --> 00:05:28,869 E aqui a mediana. 101 00:05:28,869 --> 00:05:30,529 Opa, um sinalzinho a mais. 102 00:05:30,529 --> 00:05:34,400 Então esse é o valor da média e esse é o valor da mediana. 103 00:05:34,400 --> 00:05:39,371 São informações referentes aos dados do antes, tudo bem? 104 00:05:39,371 --> 00:05:43,289 Então está aqui o nosso script, o resumo para vocês. 105 00:05:43,289 --> 00:05:47,546 Já criamos os dados do antes e o depois, 106 00:05:47,546 --> 00:05:52,963 já fizemos aqui o cálculo da média e da mediana. 107 00:05:52,963 --> 00:05:54,553 Também já fizemos. 108 00:05:54,553 --> 00:05:57,489 E agora nós vamos para uma próxima parte. 109 00:05:57,489 --> 00:06:01,660 Eu estou copiando essa parte do código, isolando-o, e vamos trazer aqui para baixo. 110 00:06:01,660 --> 00:06:05,177 Como sempre é legal apertar um pouquinho de Enter aqui 111 00:06:05,177 --> 00:06:08,265 para isolar a área do código para podermos interpretar. 112 00:06:09,682 --> 00:06:13,071 Deixe-me limpar um pouquinho aqui para facilitar a visualização. 113 00:06:13,071 --> 00:06:16,809 Opa,.. Damos um Control + Z aqui. 114 00:06:16,809 --> 00:06:19,089 Antes de apertar o Enter, você dá um Control + Z. 115 00:06:20,579 --> 00:06:22,815 "E agora, Rafa, o que nós temos?" 116 00:06:22,815 --> 00:06:27,777 Nós temos três linhas de comentário aqui para deixar para vocês, tá? 117 00:06:27,777 --> 00:06:31,265 Lembrando que às vezes esse é o momento que você pode dar uma pausa no vídeo, 118 00:06:31,265 --> 00:06:33,759 antes de eu falar ou após eu falar. 119 00:06:33,759 --> 00:06:38,664 Por quê? Porque você precisa entender esses comentários que não fazem parte da execução. 120 00:06:38,664 --> 00:06:43,969 E depois que você conseguir entender essas três linhas de comentários, 121 00:06:43,969 --> 00:06:46,872 nós poderemos fazer a execução do que precisamos. 122 00:06:46,872 --> 00:06:48,175 Vamos entender? 123 00:06:48,175 --> 00:06:50,235 O que eu criei para vocês então? 124 00:06:50,235 --> 00:06:51,642 O "moda_antes". 125 00:06:51,642 --> 00:06:53,502 É o nome de uma variável. 126 00:06:53,502 --> 00:06:55,480 Aí é sinal de menor, tracinho. 127 00:06:55,480 --> 00:06:56,682 "Ô, Rafa, já entendi. 128 00:06:56,682 --> 00:07:01,014 O resultado daqui será armazenado no moda_antes." 129 00:07:01,014 --> 00:07:03,155 "Mas o que nós estamos fazendo, Rafa?" 130 00:07:03,155 --> 00:07:04,015 Vamos aqui. 131 00:07:04,015 --> 00:07:08,495 Primeiro vem uma instrução aqui do R, "as.numeric". 132 00:07:08,495 --> 00:07:10,239 O que é isso? 133 00:07:10,239 --> 00:07:15,307 Vocês vão usar muito ainda dentro da linguagem R na parte estatística. 134 00:07:15,307 --> 00:07:19,304 É utilizado para converter os valores em vetor numérico. 135 00:07:19,304 --> 00:07:22,586 Aí pode vir uma pergunta na sua cabeça: 136 00:07:22,586 --> 00:07:24,476 "Mas, Rafa, como assim? 137 00:07:24,476 --> 00:07:26,211 Os dados são numéricos." 138 00:07:26,211 --> 00:07:31,244 Você sabe porque o conjunto de dados, essas oito horas, é pequeno. 139 00:07:31,244 --> 00:07:32,584 Mas quem garante isso? 140 00:07:32,584 --> 00:07:35,787 É sempre bom você confirmar, tá? 141 00:07:35,787 --> 00:07:39,458 Então, voltando aqui, olhando, nós sabemos que eles são numéricos, 142 00:07:39,458 --> 00:07:43,128 mas você tem que garantir isso para poder fazer essa análise. 143 00:07:43,128 --> 00:07:46,231 É isso que o as.numeric faz. 144 00:07:46,231 --> 00:07:49,701 Se não for, tiver algum probleminha lá e o dado for possível de conversão para numérico, 145 00:07:49,701 --> 00:07:52,468 ele vai ser feito, é o as.numeric. 146 00:07:53,805 --> 00:07:57,637 E aí nós vamos continuar aqui a interpretar essa parte dessa instrução. 147 00:07:58,677 --> 00:08:00,271 Aqui são os nomes. 148 00:08:00,271 --> 00:08:01,221 O que são os nomes? 149 00:08:01,221 --> 00:08:02,681 É o conjunto de valores. 150 00:08:02,681 --> 00:08:04,716 Nós temos apenas um conjunto de valores. 151 00:08:04,716 --> 00:08:05,884 Poderíamos ter mais? 152 00:08:05,884 --> 00:08:06,777 Sim. 153 00:08:06,777 --> 00:08:09,387 Se fosse um dataframe com diversas colunas? Poderia. 154 00:08:09,387 --> 00:08:12,648 Aqui nós temos uma linha, ou uma coluna. 155 00:08:12,648 --> 00:08:15,241 É um exemplo um pouco mais simples. 156 00:08:15,241 --> 00:08:16,881 E aí você entra aqui no "sort". 157 00:08:16,881 --> 00:08:18,251 O que seria o sort? 158 00:08:18,251 --> 00:08:22,238 Novamente, fica aqui um comentário para vocês. 159 00:08:22,238 --> 00:08:26,004 Vocês já tenham utilizado em alguma outra linguagem de programação. 160 00:08:26,004 --> 00:08:28,240 Quem não usou, não tem problema nenhum, tá? 161 00:08:28,240 --> 00:08:30,008 Esse é o momento de aprender. 162 00:08:30,008 --> 00:08:34,024 Ele é utilizado para ordenar os elementos. 163 00:08:34,024 --> 00:08:39,317 Porque se vocês pegarem aqui, esse o primeiro aqui do antes, 164 00:08:39,317 --> 00:08:42,254 não é obrigatório que ele esteja numa ordem crescente ou decrescente. 165 00:08:42,254 --> 00:08:43,371 "Porque não, Rafa?" 166 00:08:43,371 --> 00:08:44,145 É uma análise. 167 00:08:44,145 --> 00:08:50,428 Supondo que, na primeira hora, demorou 220 segundos para executar na segunda, 210. 168 00:08:50,428 --> 00:08:54,399 Então vai ser difícil você encontrar na ordem crescente ou decrescente. 169 00:08:54,399 --> 00:08:57,836 Você está olhando hora a hora como ele se comporta. 170 00:08:57,836 --> 00:08:59,971 O que você vai fazer então? 171 00:08:59,971 --> 00:09:02,807 Por isso que vem essa instrução sort. 172 00:09:02,807 --> 00:09:07,389 Você vai dizer que, nessa instrução true ou false, 173 00:09:07,389 --> 00:09:11,750 se você colocar true, você está pedindo para que essa análise 174 00:09:11,750 --> 00:09:15,887 seja feita numa ordem decrescente. 175 00:09:15,887 --> 00:09:20,587 Se você colocar false, ele vai fazer uma ordem crescente. 176 00:09:20,587 --> 00:09:23,278 Lembrando que decrescente, do maior para o menor, 177 00:09:23,278 --> 00:09:25,397 que vai ser como ele vai analisar esse caso. 178 00:09:25,397 --> 00:09:30,168 E se fosse crescente, do menor para o maior. 179 00:09:30,168 --> 00:09:32,804 Esse é o sort. 180 00:09:32,804 --> 00:09:36,107 Bem recheada de conhecimento essa instrução aqui. 181 00:09:36,107 --> 00:09:38,710 E o que é o "table"? 182 00:09:38,710 --> 00:09:41,513 É o conjunto de dados para ser analisado. 183 00:09:41,513 --> 00:09:45,717 Lembrando, aqui é uma linha só, que é o tempo antes, 184 00:09:45,717 --> 00:09:47,819 mas poderia ser um dataframe. 185 00:09:47,819 --> 00:09:51,590 Então esse é o conjunto de dados que nós estamos pedindo para analisar. 186 00:09:52,590 --> 00:09:54,063 Vamos apertar um Enter. 187 00:09:54,993 --> 00:09:56,028 E aí, o que nós temos? 188 00:09:56,028 --> 00:09:57,507 "Rafa, e agora?" 189 00:09:57,507 --> 00:09:58,797 Quer olhar o resultado? 190 00:09:58,797 --> 00:09:59,893 Vamos olhar, lógico. 191 00:09:59,893 --> 00:10:01,103 "print"... 192 00:10:01,103 --> 00:10:05,937 Ou você copia e cola, ou você digita e deixa ele dar a sugestão. 193 00:10:05,937 --> 00:10:08,173 Realmente é esse que eu quero. 194 00:10:08,173 --> 00:10:13,044 Se eu apertar o Enter, o que ele nos trouxe de resultado? 195 00:10:13,044 --> 00:10:17,151 Essa análise chegou num resultado de 210. 196 00:10:17,151 --> 00:10:20,150 Mas o que seria esse número 210? 197 00:10:20,150 --> 00:10:23,187 Vamos continuar aqui, aí eu vou explicar para vocês. 198 00:10:23,187 --> 00:10:26,200 Aqui foi a introdução, os dois dados, 199 00:10:26,200 --> 00:10:29,827 calculamos a média e a mediana do antes. 200 00:10:29,827 --> 00:10:33,464 E aqui, nós conseguimos fazer a moda, 201 00:10:33,464 --> 00:10:36,935 qual o número moda que é gerado com essa análise desses dados, nesse conjunto. 202 00:10:36,935 --> 00:10:40,638 De novo, continuamos com o intervalo 203 00:10:40,638 --> 00:10:44,208 de valores do antes ainda não fizemos o depois. 204 00:10:44,275 --> 00:10:45,810 Vamos continuar aí. 205 00:10:45,810 --> 00:10:50,315 Aqui nós vamos pôr uma outra parte do nosso código aqui na nossa análise. 206 00:10:50,548 --> 00:10:55,520 Vou copiar a descer lá para baixo um pouquinho 207 00:10:55,620 --> 00:10:58,623 novamente aquela velha dica, se possível, 208 00:10:58,623 --> 00:11:02,393 quer que eu, que estou transmitindo conhecimento para vocês? 209 00:11:02,493 --> 00:11:05,997 Se você quiser, não precisa apertar muito, mas é legal para vocês dividirem 210 00:11:06,097 --> 00:11:08,232 por partes. Essa análise tá? 211 00:11:08,232 --> 00:11:10,168 Aqui novamente, tem um resto, 212 00:11:10,168 --> 00:11:13,971 é só limpar o código aqui para depois quando executá lo acontecer. 213 00:11:13,971 --> 00:11:16,207 Nenhum erro 214 00:11:16,274 --> 00:11:18,476 legal aqui eu deixo esse comentário. 215 00:11:18,476 --> 00:11:23,114 Aí nós podemos verificar o que a variância que é a variância deixo aqui. 216 00:11:23,181 --> 00:11:26,818 É uma medida estatística que indica a dispersão dos valores 217 00:11:26,818 --> 00:11:28,319 em relação à média. 218 00:11:28,319 --> 00:11:33,024 Nós não temos a média o quanto os valores, que valores, 219 00:11:33,124 --> 00:11:38,563 o quanto cada um desses valores estão distantes da média. 220 00:11:38,629 --> 00:11:40,298 Por isso que nós fizemos aqui. 221 00:11:40,298 --> 00:11:44,469 Essa não é a média, deu 218 a seu olhar. 222 00:11:44,469 --> 00:11:48,840 Aqui me parece, por exemplo, qual que está mais distante, 223 00:11:48,840 --> 00:11:50,308 olhando aqui, interpretando. 224 00:11:50,308 --> 00:11:51,976 Mas você vai deixar o contador fazer por nós? 225 00:11:51,976 --> 00:11:56,347 Talvez seja esse qual tá mais perto de 218. 226 00:11:56,414 --> 00:12:00,084 Olhando aqui o valor 220 Tá, 227 00:12:00,184 --> 00:12:03,788 mas deixa o computador falar pra nós o uso desse intervalo de valores. 228 00:12:03,788 --> 00:12:08,092 Quais estão mais perto ou menos perto da média? 229 00:12:08,192 --> 00:12:10,661 Quanto maior a variância, 230 00:12:10,661 --> 00:12:14,565 mais dispersos os dados estão, ou seja, 231 00:12:14,632 --> 00:12:18,236 o valor do resultado da variação que nós vamos pedir para calcular. 232 00:12:18,336 --> 00:12:19,804 Agora 233 00:12:19,870 --> 00:12:20,571 que quanto 234 00:12:20,571 --> 00:12:24,809 mais, quanto maior o número, mais distante estará da média. 235 00:12:24,909 --> 00:12:30,181 Então tem uma disparidade aí, uma distância aí da média dos dados. 236 00:12:30,248 --> 00:12:33,217 Aí vamos executar para executar. 237 00:12:33,217 --> 00:12:38,556 Como sempre, eu vou apertar um entre aqui e aí nós vamos analisar o variância 238 00:12:38,556 --> 00:12:41,892 antes queremos encontrar como que eu acho o valor da variância, 239 00:12:42,059 --> 00:12:44,996 porque é isso que a gente acabou de explicar aqui. 240 00:12:44,996 --> 00:12:49,433 E novamente, é mérito você fazer uma pausa, anotar, 241 00:12:49,533 --> 00:12:52,536 verificar o material que está disponível para vocês, escrito, 242 00:12:52,703 --> 00:12:55,706 escrito para você depois conseguir executar aqui. 243 00:12:55,906 --> 00:13:00,945 Então aqui como que eu consigo armazenar o valor da variância 244 00:13:01,012 --> 00:13:05,816 do tempo do conjunto de dados tempos antes? 245 00:13:05,916 --> 00:13:09,520 Como que eu consigo pedir para ele achar a variância aqui? 246 00:13:09,587 --> 00:13:13,624 É simples, depois que você entendeu, o conceito é simples 247 00:13:13,691 --> 00:13:19,063 você cria uma variável, nesse caso ela de variância antes, onde antes? 248 00:13:19,130 --> 00:13:21,732 Aqui eu coloca a instrução que é var 249 00:13:21,732 --> 00:13:25,503 v a r é o nome do conjunto de dados. 250 00:13:25,569 --> 00:13:26,036 Eu quero dar 251 00:13:26,036 --> 00:13:29,106 uma olhadinha aqui e dar uma olhadinha já antecipado. 252 00:13:29,106 --> 00:13:32,943 Podemos não ter problema na variância 253 00:13:33,010 --> 00:13:36,013 antes não, é só apertar o enter, 254 00:13:36,113 --> 00:13:40,651 nós conseguimos saber qual que é o valor, o resultado da variância. 255 00:13:40,718 --> 00:13:41,685 Tá, e aí? 256 00:13:41,685 --> 00:13:46,924 Agora o desvio padrão desvio padrão, vocês já tem esse conhecimento? 257 00:13:46,924 --> 00:13:49,226 Como calcular o desvio padrão? 258 00:13:49,226 --> 00:13:53,531 Vamos criar uma variável desvio padrão antes que nós estamos analisando, 259 00:13:53,597 --> 00:13:56,567 antes da implementação da melhoria do algoritmo 260 00:13:56,567 --> 00:14:00,170 e se a instrução é qualquer o conjunto de dados. 261 00:14:00,271 --> 00:14:04,008 Rafa, podemos visualizar lógico que podemos. 262 00:14:04,108 --> 00:14:06,911 Qual que é o nome da variável desvio 263 00:14:06,911 --> 00:14:09,480 padrão antes? 264 00:14:09,480 --> 00:14:10,681 Legal. 265 00:14:10,681 --> 00:14:12,917 E aqui nós temos o desvio padrão para esse 266 00:14:12,917 --> 00:14:16,754 conjunto de valores é 7,03. 267 00:14:16,820 --> 00:14:20,124 Agora que conseguimos encontrar o valor 268 00:14:20,190 --> 00:14:21,892 da variância 269 00:14:21,892 --> 00:14:24,428 e também do desvio padrão, vamos continuar 270 00:14:24,428 --> 00:14:28,899 para conseguir concluir a análise que queremos do antes e o depois. 271 00:14:28,966 --> 00:14:30,467 Então, o que nós já vimos? 272 00:14:30,467 --> 00:14:34,705 Retomando essa parte, criamos os dados, criamos a média 273 00:14:34,705 --> 00:14:38,208 e a mediana do do antes, 274 00:14:38,275 --> 00:14:40,611 conseguimos achar a moda, 275 00:14:40,611 --> 00:14:45,883 acabamos de conseguir descobrir a variância e o desvio padrão. 276 00:14:45,949 --> 00:14:48,485 Agora vamos para essa próxima parte da análise. 277 00:14:48,485 --> 00:14:51,488 Vou copiar aqui para baixo aqui. 278 00:14:51,488 --> 00:14:54,958 Como sempre, eu vou apertar alguns pontos 279 00:14:55,025 --> 00:14:58,295 para facilitar aqui para vocês a visualização. 280 00:14:58,362 --> 00:15:00,064 Um Vou apertaram Control v. 281 00:15:00,064 --> 00:15:04,868 Deixa eu arrumar aqui para explicar o que nós vamos fazer agora 282 00:15:04,935 --> 00:15:08,806 calculando medidas descritivas para o depois. 283 00:15:08,806 --> 00:15:11,809 Agora fizemos o antes, vamos para o depois. 284 00:15:11,942 --> 00:15:15,712 Agora nós iremos repetir o script que nós fizemos anteriormente 285 00:15:15,813 --> 00:15:19,149 para a parte da execução do antes. 286 00:15:19,283 --> 00:15:20,918 Agora iremos fazer depois. 287 00:15:20,918 --> 00:15:23,887 Lembre se do cenário do case. 288 00:15:23,887 --> 00:15:28,759 Tem um sistema que ele não estava com uma performance de algoritmo tão boa, 289 00:15:28,826 --> 00:15:33,230 então fizeram uma análise extrair os tempos de execução 290 00:15:33,297 --> 00:15:36,200 antes da implementação da melhoria no algoritmo. 291 00:15:36,200 --> 00:15:39,536 E aí precisava se agora fazer uma análise do depois. 292 00:15:39,603 --> 00:15:42,339 Então no depois nós temos a base de dados. 293 00:15:42,339 --> 00:15:43,607 Como está a performance? 294 00:15:43,607 --> 00:15:47,911 Dois Depois e agora o R vai verificar o antes e o depois. 295 00:15:47,911 --> 00:15:52,516 Para fazer esse comparativo e conseguir ter uma análise descritiva, 296 00:15:52,583 --> 00:15:53,884 fizemos para o antes. 297 00:15:53,884 --> 00:15:58,222 Vamos fazer a mesma coisa agora para o conjunto de dados do depois vem 298 00:15:58,222 --> 00:15:59,289 aqui comigo. 299 00:15:59,289 --> 00:16:04,995 Então, como sempre discutindo aqui, eu deixo um comentário para vocês, 300 00:16:05,062 --> 00:16:07,998 calculando medidas descritivas para depois 301 00:16:07,998 --> 00:16:12,002 nós iremos achar a média, a média de quem alpha. 302 00:16:12,202 --> 00:16:14,137 Lembre se. Agora 303 00:16:14,137 --> 00:16:19,042 vamos trabalhar com essa base de dados, a performance do algoritmo do depois. 304 00:16:19,142 --> 00:16:21,244 Então vamos descer um pouquinho. 305 00:16:21,244 --> 00:16:26,083 Nós estamos aqui cria uma variável chamado média depois esse é o nome. 306 00:16:26,083 --> 00:16:29,386 Esse é o nome da base de dados e vamos também achar os valores. 307 00:16:29,386 --> 00:16:31,655 O valor da mediana. 308 00:16:31,655 --> 00:16:35,826 Se eu apertar um entra aqui é sempre legal visualizar o resultado, 309 00:16:35,826 --> 00:16:39,997 a média depois e o depois. 310 00:16:39,997 --> 00:16:41,465 Vou apertar o enter. 311 00:16:41,465 --> 00:16:44,468 Então essa é a média da performance do depois. 312 00:16:44,634 --> 00:16:48,305 E agora nós vamos achar também o valor da mediana Visualizar. 313 00:16:48,305 --> 00:16:51,641 Perdão, nós já temos o valor 20 314 00:16:51,708 --> 00:16:54,378 mediano, não underline. 315 00:16:54,378 --> 00:16:56,680 Depois vou apertar o então. 316 00:16:56,680 --> 00:17:02,252 Então essa é a média e essa é a mediana do depois vou subir aqui, 317 00:17:02,319 --> 00:17:05,689 vamos pegar o nosso script, tá? 318 00:17:05,756 --> 00:17:08,258 Já fizemos antes, agora 319 00:17:08,258 --> 00:17:13,730 nós estamos calculando tudo, depois vamos achar agora o valor da moda 320 00:17:13,830 --> 00:17:14,831 é a mesma coisa 321 00:17:14,831 --> 00:17:18,602 que nós fizemos do antes, só que agora é a moda para depois. 322 00:17:18,668 --> 00:17:22,005 Vamos apertar alguns enter para ficar limpa a hora 323 00:17:22,005 --> 00:17:26,443 que nossa de programação poder entender criar a variável modo 324 00:17:26,610 --> 00:17:31,848 e logo depois depois as numeric len serve serve para converter os valores 325 00:17:31,882 --> 00:17:36,620 numérico, por mais que estão ali, mas é bom confirmar que os valores existam. 326 00:17:36,720 --> 00:17:39,523 São um número, eles estão como número. 327 00:17:39,523 --> 00:17:44,160 E aqui nós temos a parte da organização dos dados em ordem decrescente. 328 00:17:44,227 --> 00:17:48,965 E aqui, qual que é o conjunto de dados aí que vai ser feita essa moda? 329 00:17:49,065 --> 00:17:52,736 O valor da moda, se eu apertar o enter é igualzinho anterior, 330 00:17:52,836 --> 00:17:56,673 só muda que agora nós estamos fazendo a análise 331 00:17:56,740 --> 00:18:01,611 para os dados do depois, porque após implementação do algoritmo, 332 00:18:01,711 --> 00:18:07,817 então a moda para o depois de um valor resultou em um valor de 190. 333 00:18:07,917 --> 00:18:13,023 Vamos voltar mais um pouquinho aqui de pegar o script que nós deixamos 334 00:18:13,089 --> 00:18:15,492 a palavra pré pronto e pronto 335 00:18:15,492 --> 00:18:18,161 e vamos verificar o já geramos a moda 336 00:18:18,161 --> 00:18:21,831 e agora nós vamos criar, que é a variância, é o desvio padrão. 337 00:18:21,931 --> 00:18:24,734 Vamos descobrir qual é o valor da variância 338 00:18:24,734 --> 00:18:29,172 e qual o valor do desvio padrão para o depois e de apertar novamente alguns. 339 00:18:29,239 --> 00:18:30,707 Então 340 00:18:30,774 --> 00:18:33,643 vou dar um control v se eu só limpar aqui, 341 00:18:33,643 --> 00:18:37,280 se a gente executar com esse tracinho aqui vai vai ocorrer um erro. 342 00:18:37,380 --> 00:18:39,682 Então o que nós temos aqui? 343 00:18:39,682 --> 00:18:41,618 Criamos uma variável chamada variância. 344 00:18:41,618 --> 00:18:46,823 Depois aqui a instrução para calcular a variância dessa base de dados 345 00:18:46,923 --> 00:18:49,159 utilizando o VAR e o desvio padrão. 346 00:18:49,159 --> 00:18:51,528 Vou apertar enter. 347 00:18:51,528 --> 00:18:53,630 A gente esperava que dá certo. 348 00:18:53,630 --> 00:18:57,867 E aqui vamos só visualizar para confirmar que deu certo. 349 00:18:57,967 --> 00:18:59,202 Visualizou? 350 00:18:59,202 --> 00:19:04,140 E agora vamos verificar o valor do desvio padrão que foi 351 00:19:04,207 --> 00:19:05,108 encontrado. 352 00:19:05,108 --> 00:19:08,745 Desvio padrão depois ou pode ter um errinho aqui? 353 00:19:08,745 --> 00:19:14,517 Pessoal, cuidado aqui eu visualizei o antes, não era o antes e sim o depois. 354 00:19:14,617 --> 00:19:15,351 Vamos ver. 355 00:19:15,351 --> 00:19:18,855 Oh, então aqui o print é um erro. 356 00:19:18,855 --> 00:19:20,824 Não é um erro do script que a gente criou. 357 00:19:20,824 --> 00:19:24,294 Tais sim, na hora de visualizar o depois. 358 00:19:24,360 --> 00:19:27,430 Oh, então essa é a variância do que tínhamos feito anteriormente. 359 00:19:27,430 --> 00:19:29,866 E agora esse erro depois que acabamos de fazer. 360 00:19:29,866 --> 00:19:30,200 Tá vendo? 361 00:19:30,200 --> 00:19:31,100 Tomem cuidado, 362 00:19:31,100 --> 00:19:35,572 senão vocês podem estar a visualizar a informação que você não queria. 363 00:19:35,672 --> 00:19:36,739 Print. 364 00:19:36,739 --> 00:19:41,678 Agora vamos verificar o que o valor do desvio padrão do depois. 365 00:19:41,711 --> 00:19:45,315 Sim, novamente depois ou antes nós já passamos. 366 00:19:45,381 --> 00:19:46,182 Esse é o valor. 367 00:19:46,182 --> 00:19:48,751 Então nova aliança do depois. 368 00:19:48,751 --> 00:19:51,220 É esse o valor do desvio padrão. 369 00:19:51,220 --> 00:19:52,488 Depois. 370 00:19:52,488 --> 00:19:55,792 Agora vamos subir aqui e verificar o nosso script 371 00:19:55,792 --> 00:19:59,028 que nós deixamos pronto aqui. Legal! 372 00:19:59,128 --> 00:20:01,898 Nós já conseguimos criar, 373 00:20:01,898 --> 00:20:05,835 vamos lembrar a média mediana, a moda, 374 00:20:05,902 --> 00:20:11,174 a variância e o desvio padrão para base de dados do antes e do depois. 375 00:20:11,240 --> 00:20:15,411 Agora podemos dizer que a gente precisa juntar tudo isso 376 00:20:15,511 --> 00:20:18,815 para visualizar esses valores aqui. 377 00:20:18,815 --> 00:20:22,285 Na verdade, seria uma impressão de tudo que nós fizemos até agora. 378 00:20:22,318 --> 00:20:26,089 Só vou apertar alguns em três aqui, mas a última parte 379 00:20:26,189 --> 00:20:27,924 são apenas duas instruções agora. 380 00:20:27,924 --> 00:20:29,559 Opa, vou apagar. 381 00:20:29,559 --> 00:20:33,196 Controlo ver o que essa última parte, Rafa, 382 00:20:33,262 --> 00:20:36,532 imprimindo os resultados aqui vamos trabalhar 383 00:20:36,532 --> 00:20:40,670 com todas as informações do antes e o depois. 384 00:20:40,737 --> 00:20:41,337 Vou apertar. 385 00:20:41,337 --> 00:20:45,708 Então é assim simples de visualizar 386 00:20:45,775 --> 00:20:49,512 o entender que está na riqueza, entender todas essas informações. 387 00:20:49,579 --> 00:20:50,646 Então o que nós temos aqui? 388 00:20:50,646 --> 00:20:54,550 Olha aqui, antes disso, aqui é um texto sempre. 389 00:20:54,550 --> 00:20:57,720 Eu quero juntar um texto com valores, eu coloco teste, aí 390 00:20:57,720 --> 00:20:59,055 eu coloco a informação, lembra? 391 00:20:59,055 --> 00:21:00,723 Divido por vírgula. 392 00:21:00,723 --> 00:21:04,460 E o nome da variável só aqui, na verdade é uma impressão 393 00:21:04,460 --> 00:21:07,163 mostrando tudo o que nós fizemos anteriormente. 394 00:21:07,163 --> 00:21:08,865 Vamos pegar o outro script. 395 00:21:08,865 --> 00:21:11,601 Poderíamos fazer aqui na mão agora, poderíamos talvez 396 00:21:11,601 --> 00:21:15,771 demorar só um pouquinho aqui para vocês, pra gente digitar junto 397 00:21:15,872 --> 00:21:18,374 para digitarmos essas informações. 398 00:21:18,374 --> 00:21:20,209 Nós apertar mais alguns inteiros. 399 00:21:20,209 --> 00:21:23,679 Aqui, como sempre, vou apertar muito o que nós temos aqui 400 00:21:23,679 --> 00:21:27,183 até um momento de uma revisão antes, 401 00:21:27,250 --> 00:21:30,920 a média antes e esse valor média antes 402 00:21:31,020 --> 00:21:34,423 e esse valor mediano 403 00:21:34,490 --> 00:21:36,359 antes mediana antes. 404 00:21:36,359 --> 00:21:39,328 Então, aqui nós só juntamos uma impressão de tudo o que nós 405 00:21:39,328 --> 00:21:42,698 projetamos anteriormente e aqui do depois. 406 00:21:42,765 --> 00:21:46,969 E é agora que fica o que se a gente pegar o nosso TO do nosso script, 407 00:21:47,036 --> 00:21:48,704 pegamos desde uma introdução. 408 00:21:48,704 --> 00:21:51,340 O que é uma análise descritiva, 409 00:21:51,340 --> 00:21:55,544 duas bases de dados com verificamos o antes e o depois, 410 00:21:55,611 --> 00:22:00,516 calculamos a média mediana, conseguimos nos achar o valor da moda 411 00:22:00,516 --> 00:22:04,920 também, tanto para os dados do antes como depois 412 00:22:04,987 --> 00:22:08,290 e enfim, só voltando, descendo um pouquinho aqui, 413 00:22:08,357 --> 00:22:11,994 agora a gente consegue imprimir e com essas informações 414 00:22:11,994 --> 00:22:15,998 em mãos nós conseguimos obter os nossos resultados. 415 00:22:16,065 --> 00:22:19,468 Então aqui é o conjunto 416 00:22:19,568 --> 00:22:20,669 mostrando o resultado. 417 00:22:20,669 --> 00:22:22,471 Todas as informações numa impressão 418 00:22:22,471 --> 00:22:26,175 só, tudo o que calculamos antes, tudo que calculamos o depois. 419 00:22:26,242 --> 00:22:28,411 E agora que você consegue fazer a interpretação, 420 00:22:28,411 --> 00:22:33,482 vamos pegar o mais simples aqui a média de tempo de execução 421 00:22:33,582 --> 00:22:36,919 do antes antes de implementar a melhoria no algoritmo. 422 00:22:37,019 --> 00:22:37,720 O tempo de execução. 423 00:22:37,720 --> 00:22:41,891 Supondo que fossem segundos, demorava 218/2. 424 00:22:41,957 --> 00:22:44,760 Agora caiu para 196 e por aí vai. 425 00:22:44,760 --> 00:22:50,432 Você consegue comparar o antes e o depois de cada uma dessas informações 426 00:22:50,499 --> 00:22:53,169 para saber se realmente 427 00:22:53,169 --> 00:22:56,138 melhorou a performance do sistema 428 00:22:56,138 --> 00:22:59,508 após a implementação da melhoria do algoritmo? 429 00:22:59,608 --> 00:23:01,210 Eu tenho certeza que vocês conseguiram 430 00:23:01,210 --> 00:23:04,980 entender a importância de saber utilizar todas essas instruções, 431 00:23:05,014 --> 00:23:09,018 a linguagem R e até mesmo saber interpretar esses resultados e.