Com certeza na sua vida pessoal ou profissional você já se deparou com uma situação que você tem que verificar a performance do antes e o depois de algo, como por exemplo, no computador da sua casa. Supondo que você vai aumentar a memória RAM, e ele está demorando cinco minutos para iniciar, e aí você coloca memória RAM, depois você quer verificar o quanto melhorou, ou se melhorou, então você está fazendo uma análise do antes e o depois. E a nossa linguagem R também nos ajuda a fazer a análise do antes e o depois. Só que, nesse caso, nós precisamos ter dados que consigam fazer essa comparação. Vamos trazer aqui um exemplo para vocês. Nesse exemplo, pense num caso real da fábrica de software. Nós temos lá um sistema funcionando que vai para a produção e aí descobrimos que a performance dele não está muito boa. Fizeram uma medição hora a hora nessa nossa performance. Então, após essa análise de uma performance não tão boa, melhorar o algoritmo, que é a lógica que está dentro do sistema, e, após, fazer uma nova medição. É isso que vamos ver agora, vamos fazer uma análise descritiva do antes e depois para vocês terem a confiança dos dados que estão sendo analisados, e até mesmo o seu resultado. Vem comigo que eu vou mostrar para vocês. Como sempre, eu deixo um script pronto, não somente as linhas de execução, o código do que precisamos fazer, mas também um comentário. Um breve resumo da análise descritiva está aqui no começo. Depois, se você quiser fazer uma pausa, ler e interpretar sobre o que é uma análise descritiva, aqui fica um breve resumo. Então, como nós falamos, nós precisamos de uma base de dados para poder analisar isso. Vamos rodar essas duas linhas aqui, criar os nossos dados para ter esse comparativo do antes e o depois. Se pegar aqui... Perdão. Vamos dar uns Enters aqui. Sempre apertamos alguns Enters para ficar uma área limpa aqui. Então nós estamos criando aqui um comentário, uma hashtag. O tempo antes da performance: hora um, hora dois, hora três. Aqui nós temos quatro, cinco, seis, sete, oito. É uma análise do antes e o depois em oito horas de execução de um código, por exemplo. Antes de implementar a melhoria no algoritmo, e depois de implementar a melhoria no algoritmo. Vamos apertar o Enter. E aí, como sempre, é legal visualizar como estão os dados O tempo antes. Apertem enter. Opa, o que eu errei aqui frente a tempos? Oh, tá vendo que que é isso que eu errei o tempo antes? Agora vai funcionar? Então aqui tem a letra S. São tempos né? Eu não tinha colocado esse intervalo. Roupa not found not found quer dizer que não existe. Ai depois eu coloquei certo? Então siga aquela velha dica vocês colocam aqui print ou vocês copiam o nome da variável e coloca aqui no conjunto de dados, ou você digita e ele dá a sugestão do nome. Aqui no caso ele deu a sugestão. Sugestão está correta, eu vou apertar. Então temos a análise do antes e o depois, esse aqui facilitando a interpretação se for verificar. Como sempre estamos conjunto de valores bem pequeno para facilitar aqui a nossa análise. Olhando nós já podemos fazer esse resultado Pré aviso prévio sem o R Sim, o antes e o depois o depois. Ficou melhor então implementar a melhoria no algoritmo e houve realmente uma melhor performance no sistema, inclusive olhando em todas as horas de execução. Realmente está melhor. Agora estava eu olhando, eu consigo, mas se fosse uma análise com 300 horas de execução ia ficar bem difícil de vocês conseguirem olhar. Então vamos pedir para o R. E fazer aqui para nós o que a gente vai fazer. Vamos para a próxima parte. Então criamos o antes e o depois, Vamos apertar mais alguns entre eles aqui. Legal para facilitar nossa área, nós vamos para uma próxima parte. Nós vamos agora gerar todo o cenário para calcular o que as medidas descritivas para o antes. Então nós vamos fazer uma análise primeiro do antes, preparar esses dados do antes. Aqui o que vamos calcular A média simples do antes. E nós vamos calcular a mediana do antes. Vamos aqui, vou apertar o enter, vou apertar print. Oh, média aí, aqui aquela velha história ou você copia média média antes ou você deixa ele fazer a sugestão para você. Então essa é a média. Se somar todos esses valores são quatro, cinco, seis, oito valores, são 08h00 de análise, somo divide por oito e só vai ser a média. E aqui nós também pedimos para calcular, além de calcular a média que acabamos de visualizar, calcular também a mediana. Vamos visualizar o valor da mediana. Ô Rafa, a gente está tendo que utilizar os conceitos que aprendemos anteriormente. Sim, isso é bom, né? As coisas vão se juntando e aqui a mediana, o sinalzinho a mais. Então esse é o valor da média e esse é o valor da mediana. Isso são informações referente aos dados do antes, tudo bem? Então olha, no nosso script já aqui está o resumo para vocês. Os dados do antes e o depois já criamos. Nós fizemos aqui o cálculo da média e da mediana já fizemos também. E agora nós vamos para uma próxima parte. Deixa eu copiar nessa parte do código isolando e vamos trazer aqui para baixo. Como sempre legal apertar um pouquinho de enter aqui para isolar a área do código para poder interpretar. Deixa eu limpar um pouquinho aqui para facilitar a visualização. Opa, o que temos não controls aqui antes se apertar o enter dá pra você dar um control, usar legal. E agora Rafa, que que nós temos? Nós temos três linhas de comentário aqui para deixar para vocês. Tá lembrando? Às vezes esse é o momento que você pode dar uma pausa no vídeo antes de eu falar ou após eu falar. Por que você precisa entender esses comentários que não faz parte da execução? É para. Depois que você conseguir entender essas três linhas de comentários, nós poderemos fazer a execução do que a gente precisa. Vamos entender então o que eu criei para vocês. O modo underline antes aqui é um nome de uma variável, ai é sinal de menor tracinho. O Rafa, já entendi. O resultado daqui será armazenado no módulo de antes que a gente está fazendo. Rafa, vamos aqui e primeiro vem uma instrução aqui do R. E esse ponto numérico que está deixa isso. Vamos usar muito ainda dentro da linguagem R na parte estatística, tal é utilizado para converter os valores em vetor numérico. Aí você pode vira uma pergunta na sua cabeça Mas Rafa, como assim? Os dados são numéricos? Mas você sabe porque o conjunto de dados? Essas 08h00 são pequenos, mas quem garante isso? É sempre bom você confirmar, tá? Então, voltando aqui olhando, nós sabemos que eles são numéricos, mas você tem que garantir isso para poder fazer essa análise. É isso que o ponto numérico faz. Se não for algum probleminha lá e o dado for possível de conversão para numérico, ele vai ser feito e o ponto numérico legal. E aí nós vamos continuar aqui a interpretar essa parte dessa instrução. Aqui são os nomes que são os nomes e o conjunto de valores. Temos apenas um conjunto de valores. Poderíamos ter mais? Sim, se fosse data.frame com diversas colunas, poderia? Aqui nós temos, vamos dizer, uma linha ou uma coluna e um exemplo um pouco mais simples e aí entra aqui no sort que seria o sort novamente. Fica aqui um comentário para vocês. Talvez vocês já podem ter utilizado em alguma outra linguagem de programação. Quem não usou não tem problema nenhum. Esse é o momento de aprender. Ele é utilizado para ordenar os elementos, porque se vocês pegarem aqui, esse, por exemplo, o primeiro aqui do antes, não é obrigatório que ele esteja numa ordem crescente ou decrescente. Porque não, Rafa? É uma análise na primeira hora a demorou supondo 220/2 para executar na segunda 210. Então vai ser difícil se encontrar uma coisa na ordem crescente decrescente. Você está olhando algo hora a hora. Como ele se comporta? Então aí o que você vai fazer, tá? Por isso que vem essa instrução sort. E o que você vai vai dizer é essa instrução true ou false. Você colocar true. Você está pedindo para que essa análise seja feita numa ordem, o que de decrescente? Se você colocar false, ele vai fazendo uma ordem numa ordem crescente, lembrando decrescente do maior para o menor, que vai ser esse caso, como ele vai analisar? E se fosse crescente, do menor para o maior? Tudo bem, esse é o sort bem recheado de conhecimento aqui essa instrução. E aí, o que é o tempo? É o conjunto de dados que está para ser analisado. Lembrando, aqui é uma linha só que é o tempo antes, mas poderia ser um dataframe então. Então esse é o conjunto de dados que nós estamos pedindo para analisar. Vamos apertar um enter. E é aí que nós temos Rafa. E agora é que é olhar o resultado. Vamos olhar lógico, print ou você copia e cola ou você digita e deixe me dar sugestão. Realmente é isso que eu quero. Se eu apertar o enter, o que ele nos trouxe de resultado, tá? Essa análise foi chegou num resultado de 210, mas o que seria esse número 210? Rafa? Vamos continuar aqui. Aí eu vou explicar para vocês. Então aqui está o foi Introdução Os dois dados que calculamos, a média e a mediana do antes. E aqui nós conseguimos fazer o que a moda AND com o número modo que é gerado com essa análise desses dados. Nesse conjunto, de novo, continuamos com o intervalo de valores do antes ainda não fizemos o depois. Vamos continuar aí. Aqui nós vamos pôr uma outra parte do nosso código aqui na nossa análise. Vou copiar a descer lá para baixo um pouquinho novamente aquela velha dica, se possível, quer que eu, que estou transmitindo conhecimento para vocês? Se você quiser, não precisa apertar muito, mas é legal para vocês dividirem por partes. Essa análise tá? Aqui novamente, tem um resto, é só limpar o código aqui para depois quando executá lo acontecer. Nenhum erro legal aqui eu deixo esse comentário. Aí nós podemos verificar o que a variância que é a variância deixo aqui. É uma medida estatística que indica a dispersão dos valores em relação à média. Nós não temos a média o quanto os valores, que valores, o quanto cada um desses valores estão distantes da média. Por isso que nós fizemos aqui. Essa não é a média, deu 218 a seu olhar. Aqui me parece, por exemplo, qual que está mais distante, olhando aqui, interpretando. Mas você vai deixar o contador fazer por nós? Talvez seja esse qual tá mais perto de 218. Olhando aqui o valor 220 Tá, mas deixa o computador falar pra nós o uso desse intervalo de valores. Quais estão mais perto ou menos perto da média? Quanto maior a variância, mais dispersos os dados estão, ou seja, o valor do resultado da variação que nós vamos pedir para calcular. Agora que quanto mais, quanto maior o número, mais distante estará da média. Então tem uma disparidade aí, uma distância aí da média dos dados. Aí vamos executar para executar. Como sempre, eu vou apertar um entre aqui e aí nós vamos analisar o variância antes queremos encontrar como que eu acho o valor da variância, porque é isso que a gente acabou de explicar aqui. E novamente, é mérito você fazer uma pausa, anotar, verificar o material que está disponível para vocês, escrito, escrito para você depois conseguir executar aqui. Então aqui como que eu consigo armazenar o valor da variância do tempo do conjunto de dados tempos antes? Como que eu consigo pedir para ele achar a variância aqui? É simples, depois que você entendeu, o conceito é simples você cria uma variável, nesse caso ela de variância antes, onde antes? Aqui eu coloca a instrução que é var v a r é o nome do conjunto de dados. Eu quero dar uma olhadinha aqui e dar uma olhadinha já antecipado. Podemos não ter problema na variância antes não, é só apertar o enter, nós conseguimos saber qual que é o valor, o resultado da variância. Tá, e aí? Agora o desvio padrão desvio padrão, vocês já tem esse conhecimento? Como calcular o desvio padrão? Vamos criar uma variável desvio padrão antes que nós estamos analisando, antes da implementação da melhoria do algoritmo e se a instrução é qualquer o conjunto de dados. Rafa, podemos visualizar lógico que podemos. Qual que é o nome da variável desvio padrão antes? Legal. E aqui nós temos o desvio padrão para esse conjunto de valores é 7,03. Agora que conseguimos encontrar o valor da variância e também do desvio padrão, vamos continuar para conseguir concluir a análise que queremos do antes e o depois. Então, o que nós já vimos? Retomando essa parte, criamos os dados, criamos a média e a mediana do do antes, conseguimos achar a moda, acabamos de conseguir descobrir a variância e o desvio padrão. Agora vamos para essa próxima parte da análise. Vou copiar aqui para baixo aqui. Como sempre, eu vou apertar alguns pontos para facilitar aqui para vocês a visualização. Um Vou apertaram Control v. Deixa eu arrumar aqui para explicar o que nós vamos fazer agora calculando medidas descritivas para o depois. Agora fizemos o antes, vamos para o depois. Agora nós iremos repetir o script que nós fizemos anteriormente para a parte da execução do antes. Agora iremos fazer depois. Lembre se do cenário do case. Tem um sistema que ele não estava com uma performance de algoritmo tão boa, então fizeram uma análise extrair os tempos de execução antes da implementação da melhoria no algoritmo. E aí precisava se agora fazer uma análise do depois. Então no depois nós temos a base de dados. Como está a performance? Dois Depois e agora o R vai verificar o antes e o depois. Para fazer esse comparativo e conseguir ter uma análise descritiva, fizemos para o antes. Vamos fazer a mesma coisa agora para o conjunto de dados do depois vem aqui comigo. Então, como sempre discutindo aqui, eu deixo um comentário para vocês, calculando medidas descritivas para depois nós iremos achar a média, a média de quem alpha. Lembre se. Agora vamos trabalhar com essa base de dados, a performance do algoritmo do depois. Então vamos descer um pouquinho. Nós estamos aqui cria uma variável chamado média depois esse é o nome. Esse é o nome da base de dados e vamos também achar os valores. O valor da mediana. Se eu apertar um entra aqui é sempre legal visualizar o resultado, a média depois e o depois. Vou apertar o enter. Então essa é a média da performance do depois. E agora nós vamos achar também o valor da mediana Visualizar. Perdão, nós já temos o valor 20 mediano, não underline. Depois vou apertar o então. Então essa é a média e essa é a mediana do depois vou subir aqui, vamos pegar o nosso script, tá? Já fizemos antes, agora nós estamos calculando tudo, depois vamos achar agora o valor da moda é a mesma coisa que nós fizemos do antes, só que agora é a moda para depois. Vamos apertar alguns enter para ficar limpa a hora que nossa de programação poder entender criar a variável modo e logo depois depois as numeric len serve serve para converter os valores numérico, por mais que estão ali, mas é bom confirmar que os valores existam. São um número, eles estão como número. E aqui nós temos a parte da organização dos dados em ordem decrescente. E aqui, qual que é o conjunto de dados aí que vai ser feita essa moda? O valor da moda, se eu apertar o enter é igualzinho anterior, só muda que agora nós estamos fazendo a análise para os dados do depois, porque após implementação do algoritmo, então a moda para o depois de um valor resultou em um valor de 190. Vamos voltar mais um pouquinho aqui de pegar o script que nós deixamos a palavra pré pronto e pronto e vamos verificar o já geramos a moda e agora nós vamos criar, que é a variância, é o desvio padrão. Vamos descobrir qual é o valor da variância e qual o valor do desvio padrão para o depois e de apertar novamente alguns. Então vou dar um control v se eu só limpar aqui, se a gente executar com esse tracinho aqui vai vai ocorrer um erro. Então o que nós temos aqui? Criamos uma variável chamada variância. Depois aqui a instrução para calcular a variância dessa base de dados utilizando o VAR e o desvio padrão. Vou apertar enter. A gente esperava que dá certo. E aqui vamos só visualizar para confirmar que deu certo. Visualizou? E agora vamos verificar o valor do desvio padrão que foi encontrado. Desvio padrão depois ou pode ter um errinho aqui? Pessoal, cuidado aqui eu visualizei o antes, não era o antes e sim o depois. Vamos ver. Oh, então aqui o print é um erro. Não é um erro do script que a gente criou. Tais sim, na hora de visualizar o depois. Oh, então essa é a variância do que tínhamos feito anteriormente. E agora esse erro depois que acabamos de fazer. Tá vendo? Tomem cuidado, senão vocês podem estar a visualizar a informação que você não queria. Print. Agora vamos verificar o que o valor do desvio padrão do depois. Sim, novamente depois ou antes nós já passamos. Esse é o valor. Então nova aliança do depois. É esse o valor do desvio padrão. Depois. Agora vamos subir aqui e verificar o nosso script que nós deixamos pronto aqui. Legal! Nós já conseguimos criar, vamos lembrar a média mediana, a moda, a variância e o desvio padrão para base de dados do antes e do depois. Agora podemos dizer que a gente precisa juntar tudo isso para visualizar esses valores aqui. Na verdade, seria uma impressão de tudo que nós fizemos até agora. Só vou apertar alguns em três aqui, mas a última parte são apenas duas instruções agora. Opa, vou apagar. Controlo ver o que essa última parte, Rafa, imprimindo os resultados aqui vamos trabalhar com todas as informações do antes e o depois. Vou apertar. Então é assim simples de visualizar o entender que está na riqueza, entender todas essas informações. Então o que nós temos aqui? Olha aqui, antes disso, aqui é um texto sempre. Eu quero juntar um texto com valores, eu coloco teste, aí eu coloco a informação, lembra? Divido por vírgula. E o nome da variável só aqui, na verdade é uma impressão mostrando tudo o que nós fizemos anteriormente. Vamos pegar o outro script. Poderíamos fazer aqui na mão agora, poderíamos talvez demorar só um pouquinho aqui para vocês, pra gente digitar junto para digitarmos essas informações. Nós apertar mais alguns inteiros. Aqui, como sempre, vou apertar muito o que nós temos aqui até um momento de uma revisão antes, a média antes e esse valor média antes e esse valor mediano antes mediana antes. Então, aqui nós só juntamos uma impressão de tudo o que nós projetamos anteriormente e aqui do depois. E é agora que fica o que se a gente pegar o nosso TO do nosso script, pegamos desde uma introdução. O que é uma análise descritiva, duas bases de dados com verificamos o antes e o depois, calculamos a média mediana, conseguimos nos achar o valor da moda também, tanto para os dados do antes como depois e enfim, só voltando, descendo um pouquinho aqui, agora a gente consegue imprimir e com essas informações em mãos nós conseguimos obter os nossos resultados. Então aqui é o conjunto mostrando o resultado. Todas as informações numa impressão só, tudo o que calculamos antes, tudo que calculamos o depois. E agora que você consegue fazer a interpretação, vamos pegar o mais simples aqui a média de tempo de execução do antes antes de implementar a melhoria no algoritmo. O tempo de execução. Supondo que fossem segundos, demorava 218/2. Agora caiu para 196 e por aí vai. Você consegue comparar o antes e o depois de cada uma dessas informações para saber se realmente melhorou a performance do sistema após a implementação da melhoria do algoritmo? Eu tenho certeza que vocês conseguiram entender a importância de saber utilizar todas essas instruções, a linguagem R e até mesmo saber interpretar esses resultados e.