Com certeza na sua vida
pessoal ou profissional
você já se deparou com uma situação
que você tem que verificar a performance
do antes e o depois de algo, como
por exemplo, no computador da sua casa.
Supondo que você vai
aumentar a memória RAM,
e ele está demorando cinco minutos
para iniciar, e aí você coloca memória RAM,
depois você quer verificar o quanto
melhorou, ou se melhorou,
então você está fazendo
uma análise do antes e o depois.
E a nossa linguagem R também nos ajuda
a fazer a análise do antes e o depois.
Só que, nesse caso, nós precisamos ter dados
que consigam fazer essa comparação.
Vamos trazer aqui
um exemplo para vocês.
Nesse exemplo, pense num caso
real da fábrica de software.
Nós temos lá um sistema funcionando
que vai para a produção
e aí descobrimos que a performance
dele não está muito boa.
Fizeram uma medição hora
a hora nessa nossa performance.
Então, após essa análise
de uma performance não tão boa,
melhorar o algoritmo, que é
a lógica que está dentro do sistema,
e, após, fazer uma nova medição.
É isso que vamos ver agora,
vamos fazer uma análise descritiva
do antes e depois, você ter a confiança
dos dados que estão sendo analisados
e até mesmo o seu resultado.
Vem comigo que eu vou
mostrar para vocês aqui.
Como sempre, eu deixo um script pronto,
não somente as linhas de execução,
o código do que precisamos fazer,
mas também um comentário.
Um breve resumo da análise
descritiva está aqui no começo.
Depois, se até o momento que você
vai fazer uma pausa, ler e interpretar
sobre o que é uma análise descritiva,
aqui fica um breve resumo.
Então, como nós falamos, nós
precisamos de uma base de dados
para poder analisar isso.
Vamos rodar essas duas linhas aqui,
criar os nossos dados
para ter esse comparativo
do antes e o depois.
Se pegar aqui, verdade, vamos dar uns três,
três sempre perdemos alguns antes
para ficar uma hora limpa aqui.
Então nós estamos criando aqui
o que se é um comentário ou uma hashtag.
O tempo antes da performance,
ora um, ora dois, ora três.
Aqui nós temos quatro,
cinco, seis, sete, oito
e uma análise do antes e o depois
em 08h00 de execução de um código,
por exemplo,
antes de implementar melhoria no algoritmo
e depois implementar a melhoria
no algoritmo, vamos apertar enter. E aí,
como sempre, é legal visualizar
como estão os dados O tempo antes.
Apertem enter.
Opa, o que eu errei aqui frente a tempos?
Oh, tá vendo que que é isso que eu errei
o tempo antes?
Agora vai funcionar?
Então aqui tem a letra S. São tempos né?
Eu não tinha colocado esse intervalo.
Roupa not found not found
quer dizer que não existe.
Ai depois eu coloquei certo?
Então siga aquela velha dica
vocês colocam aqui print ou vocês
copiam o nome da variável
e coloca aqui no conjunto de dados,
ou você digita
e ele dá a sugestão do nome.
Aqui no caso ele deu a sugestão.
Sugestão está correta, eu vou apertar.
Então temos a análise do antes e o depois,
esse aqui facilitando a interpretação
se for verificar.
Como sempre estamos conjunto de valores
bem pequeno
para facilitar aqui a nossa análise.
Olhando nós já podemos
fazer esse resultado
Pré aviso prévio sem o R
Sim, o antes e o depois o depois.
Ficou melhor
então implementar a melhoria no algoritmo
e houve realmente
uma melhor performance no sistema,
inclusive olhando
em todas as horas de execução.
Realmente está melhor.
Agora estava eu olhando, eu consigo,
mas se fosse uma análise
com 300 horas de execução ia ficar bem
difícil de vocês conseguirem olhar.
Então vamos pedir para o R.
E fazer aqui para nós
o que a gente vai fazer.
Vamos para a próxima parte.
Então criamos o antes e o depois,
Vamos apertar mais alguns entre eles aqui.
Legal para facilitar nossa área,
nós vamos para uma próxima parte.
Nós vamos agora gerar todo o cenário
para calcular
o que as medidas descritivas para o antes.
Então nós vamos fazer uma análise primeiro
do antes, preparar esses dados do antes.
Aqui o que vamos calcular
A média simples do antes.
E nós vamos calcular a mediana do antes.
Vamos aqui, vou apertar o enter,
vou apertar print.
Oh, média aí, aqui aquela velha história
ou você copia média média
antes ou você
deixa ele fazer a sugestão para você.
Então essa é a média.
Se somar todos esses valores são
quatro, cinco, seis, oito valores,
são 08h00 de análise, somo divide por oito
e só vai ser a média.
E aqui nós também pedimos para calcular,
além de calcular
a média que acabamos de visualizar,
calcular também a mediana.
Vamos visualizar o valor da mediana.
Ô Rafa, a gente está tendo que utilizar
os conceitos que aprendemos anteriormente.
Sim, isso é bom, né?
As coisas vão se juntando
e aqui a mediana, o sinalzinho a mais.
Então esse é o valor da média
e esse é o valor da mediana.
Isso são informações
referente aos dados do antes, tudo bem?
Então olha, no nosso script
já aqui está o resumo para vocês.
Os dados do antes e o depois já criamos.
Nós fizemos aqui o cálculo da média
e da mediana já fizemos também.
E agora nós vamos para uma próxima parte.
Deixa eu copiar nessa parte do código
isolando e vamos trazer aqui para baixo.
Como sempre legal
apertar um pouquinho de enter
aqui para isolar a área do código
para poder interpretar.
Deixa eu
limpar um pouquinho aqui
para facilitar a visualização.
Opa, o que temos não controls aqui
antes se apertar o enter dá pra você
dar um control, usar legal.
E agora Rafa, que que nós temos?
Nós temos três linhas de comentário
aqui para deixar para vocês.
Tá lembrando?
Às vezes
esse é o momento que você pode dar
uma pausa no vídeo
antes de eu falar ou após eu falar.
Por que você precisa entender esses
comentários que não faz parte da execução?
É para.
Depois que você conseguir entender
essas três linhas de comentários,
nós poderemos fazer a execução
do que a gente precisa.
Vamos entender
então o que eu criei para vocês.
O modo underline antes
aqui é um nome de uma variável,
ai é sinal de menor tracinho.
O Rafa, já entendi.
O resultado daqui será armazenado
no módulo de
antes que a gente está fazendo.
Rafa, vamos aqui e primeiro
vem uma instrução aqui do R.
E esse ponto numérico que está deixa isso.
Vamos usar muito ainda dentro da linguagem
R na parte estatística, tal
é utilizado para converter os valores
em vetor numérico.
Aí você pode vira uma pergunta
na sua cabeça Mas Rafa, como assim?
Os dados são numéricos?
Mas você sabe porque o conjunto de dados?
Essas 08h00 são pequenos,
mas quem garante isso?
É sempre bom você confirmar, tá?
Então, voltando aqui olhando,
nós sabemos que eles são numéricos,
mas você tem que garantir isso
para poder fazer essa análise.
É isso que o ponto numérico faz.
Se não for algum probleminha lá
e o dado for possível de conversão
para numérico, ele vai ser feito
e o ponto numérico legal.
E aí nós vamos continuar aqui
a interpretar essa parte dessa instrução.
Aqui são os nomes que são os nomes
e o conjunto de valores.
Temos apenas um conjunto de valores.
Poderíamos ter mais?
Sim, se fosse data.frame com diversas
colunas, poderia?
Aqui nós temos, vamos dizer,
uma linha ou uma coluna e um exemplo
um pouco mais simples e aí entra aqui
no sort que seria o sort novamente.
Fica aqui um comentário para vocês.
Talvez
vocês já podem ter utilizado
em alguma outra linguagem de programação.
Quem não usou não tem problema nenhum.
Esse é o momento de aprender.
Ele é utilizado para ordenar os elementos,
porque se vocês pegarem aqui,
esse, por exemplo,
o primeiro aqui do antes,
não é obrigatório que ele esteja
numa ordem crescente ou decrescente.
Porque não, Rafa?
É uma análise na primeira hora
a demorou supondo 220/2 para executar
na segunda 210.
Então vai ser difícil se encontrar
uma coisa na ordem crescente decrescente.
Você está olhando algo hora a hora.
Como ele se comporta?
Então aí o que você vai fazer, tá?
Por isso que vem essa instrução sort.
E o que você vai
vai dizer é essa instrução true ou false.
Você colocar true.
Você está pedindo para que essa análise
seja feita numa ordem,
o que de decrescente?
Se você colocar false,
ele vai fazendo uma ordem
numa ordem crescente,
lembrando decrescente do maior
para o menor, que vai ser esse caso,
como ele vai analisar?
E se fosse crescente, do menor
para o maior?
Tudo bem, esse é o sort
bem recheado de conhecimento
aqui essa instrução.
E aí, o que é o tempo?
É o conjunto
de dados que está para ser analisado.
Lembrando, aqui é uma linha
só que é o tempo antes,
mas poderia ser um dataframe então.
Então esse é o conjunto de dados
que nós estamos pedindo para analisar.
Vamos apertar um enter.
E é aí que nós temos Rafa.
E agora é que é olhar o resultado.
Vamos olhar lógico, print ou você
copia e cola ou você digita
e deixe me dar sugestão.
Realmente é isso que eu quero.
Se eu apertar o enter,
o que ele nos trouxe de resultado, tá?
Essa análise foi chegou num resultado
de 210, mas o que seria esse número 210?
Rafa? Vamos continuar aqui.
Aí eu vou explicar para vocês.
Então aqui está o foi Introdução
Os dois dados
que calculamos,
a média e a mediana do antes.
E aqui
nós conseguimos fazer o que a moda AND
com o número modo que
é gerado com essa análise desses dados.
Nesse conjunto, de novo,
continuamos com o intervalo
de valores do antes
ainda não fizemos o depois.
Vamos continuar aí.
Aqui nós vamos pôr uma outra parte
do nosso código aqui na nossa análise.
Vou copiar a descer lá para baixo
um pouquinho
novamente aquela velha dica, se possível,
quer que eu, que estou transmitindo
conhecimento para vocês?
Se você quiser, não precisa apertar muito,
mas é legal para vocês dividirem
por partes. Essa análise tá?
Aqui novamente, tem um resto,
é só limpar o código aqui para depois
quando executá lo acontecer.
Nenhum erro
legal aqui eu deixo esse comentário.
Aí nós podemos verificar o que a variância
que é a variância deixo aqui.
É uma medida estatística
que indica a dispersão dos valores
em relação à média.
Nós não temos a média o quanto os valores,
que valores,
o quanto cada um desses valores
estão distantes da média.
Por isso que nós fizemos aqui.
Essa não é a média, deu 218 a seu olhar.
Aqui me parece, por exemplo,
qual que está mais distante,
olhando aqui, interpretando.
Mas você vai deixar o contador
fazer por nós?
Talvez seja esse
qual tá mais perto de 218.
Olhando aqui o valor 220 Tá,
mas deixa o computador falar pra nós
o uso desse intervalo de valores.
Quais estão mais perto
ou menos perto da média?
Quanto maior a variância,
mais dispersos os dados estão, ou seja,
o valor do resultado da variação
que nós vamos pedir para calcular.
Agora
que quanto
mais, quanto maior o número,
mais distante estará da média.
Então tem uma disparidade aí,
uma distância aí da média dos dados.
Aí vamos executar para executar.
Como sempre, eu vou apertar um entre
aqui e aí nós vamos analisar o variância
antes queremos encontrar
como que eu acho o valor da variância,
porque é isso que a gente acabou
de explicar aqui.
E novamente,
é mérito você fazer uma pausa, anotar,
verificar o material
que está disponível para vocês, escrito,
escrito para você
depois conseguir executar aqui.
Então aqui como que eu consigo armazenar
o valor da variância
do tempo
do conjunto de dados tempos antes?
Como que eu consigo pedir
para ele achar a variância aqui?
É simples, depois que você entendeu,
o conceito é simples
você cria uma variável, nesse caso
ela de variância antes, onde antes?
Aqui eu coloca a instrução que é var
v a r é o nome do conjunto de dados.
Eu quero dar
uma olhadinha aqui e dar uma olhadinha
já antecipado.
Podemos não ter problema na variância
antes não, é só apertar o enter,
nós conseguimos saber qual que é o valor,
o resultado da variância.
Tá, e aí?
Agora o desvio padrão desvio padrão,
vocês já tem esse conhecimento?
Como calcular o desvio padrão?
Vamos criar uma variável desvio padrão
antes que nós estamos analisando,
antes da implementação
da melhoria do algoritmo
e se a instrução é qualquer
o conjunto de dados.
Rafa,
podemos visualizar lógico que podemos.
Qual que é o nome da variável desvio
padrão antes?
Legal.
E aqui nós temos o desvio padrão para esse
conjunto de valores é 7,03.
Agora que conseguimos encontrar o valor
da variância
e também do desvio padrão, vamos continuar
para conseguir concluir a análise
que queremos do antes e o depois.
Então, o que nós já vimos?
Retomando essa parte, criamos os dados,
criamos a média
e a mediana do do antes,
conseguimos achar a moda,
acabamos de conseguir descobrir
a variância e o desvio padrão.
Agora vamos para essa
próxima parte da análise.
Vou copiar aqui para baixo aqui.
Como sempre, eu vou apertar alguns pontos
para facilitar aqui para vocês
a visualização.
Um Vou apertaram Control v.
Deixa eu arrumar aqui
para explicar o que nós vamos fazer agora
calculando
medidas descritivas para o depois.
Agora fizemos o antes,
vamos para o depois.
Agora nós iremos repetir o script
que nós fizemos anteriormente
para a parte da execução do antes.
Agora iremos fazer depois.
Lembre se do cenário do case.
Tem um sistema que ele não estava
com uma performance de algoritmo tão boa,
então fizeram uma análise
extrair os tempos de execução
antes da implementação da melhoria
no algoritmo.
E aí precisava
se agora fazer uma análise do depois.
Então no depois nós temos a base de dados.
Como está a performance?
Dois Depois e agora o R
vai verificar o antes e o depois.
Para fazer esse comparativo
e conseguir ter uma análise descritiva,
fizemos para o antes.
Vamos fazer a mesma coisa agora
para o conjunto de dados do depois vem
aqui comigo.
Então, como sempre discutindo aqui,
eu deixo um comentário para vocês,
calculando medidas descritivas para depois
nós iremos achar a média,
a média de quem alpha.
Lembre se. Agora
vamos trabalhar com essa base de dados,
a performance do algoritmo do depois.
Então vamos descer um pouquinho.
Nós estamos aqui cria uma variável
chamado média depois esse é o nome.
Esse é o nome da base de dados
e vamos também achar os valores.
O valor da mediana.
Se eu apertar um entra aqui é sempre legal
visualizar o resultado,
a média depois e o depois.
Vou apertar o enter.
Então essa é a média
da performance do depois.
E agora nós vamos achar também
o valor da mediana Visualizar.
Perdão, nós já temos o valor 20
mediano, não underline.
Depois vou apertar o então.
Então essa é a média e essa é a mediana do
depois vou subir aqui,
vamos pegar o nosso script, tá?
Já fizemos antes, agora
nós estamos calculando tudo,
depois vamos achar agora o valor da moda
é a mesma coisa
que nós fizemos do antes,
só que agora é a moda para depois.
Vamos apertar alguns enter
para ficar limpa a hora
que nossa de programação
poder entender criar a variável modo
e logo depois depois as numeric len serve
serve para converter os valores
numérico, por mais que estão ali, mas
é bom confirmar que os valores existam.
São um número, eles estão como número.
E aqui nós temos a parte da organização
dos dados em ordem decrescente.
E aqui, qual que é o conjunto de dados aí
que vai ser feita essa moda?
O valor da moda, se eu apertar o enter
é igualzinho anterior,
só muda que
agora nós estamos fazendo a análise
para os dados do depois,
porque após implementação do algoritmo,
então a moda para o depois de um valor
resultou em um valor de 190.
Vamos voltar mais um pouquinho aqui
de pegar o script que nós deixamos
a palavra pré pronto e pronto
e vamos verificar o já geramos a moda
e agora nós vamos criar,
que é a variância, é o desvio padrão.
Vamos descobrir
qual é o valor da variância
e qual o valor do desvio padrão para o
depois e de apertar novamente alguns.
Então
vou dar um control v se eu só limpar aqui,
se a gente executar com esse tracinho
aqui vai vai ocorrer um erro.
Então o que nós temos aqui?
Criamos uma variável chamada variância.
Depois aqui a instrução para calcular
a variância dessa base de dados
utilizando o VAR e o desvio padrão.
Vou apertar enter.
A gente esperava que dá certo.
E aqui vamos só visualizar
para confirmar que deu certo.
Visualizou?
E agora vamos verificar
o valor do desvio padrão que foi
encontrado.
Desvio padrão
depois ou pode ter um errinho aqui?
Pessoal, cuidado aqui eu visualizei
o antes, não era o antes e sim o depois.
Vamos ver.
Oh, então aqui o print é um erro.
Não é um erro do script que a gente criou.
Tais sim, na hora de visualizar o depois.
Oh, então essa é a variância
do que tínhamos feito anteriormente.
E agora esse erro
depois que acabamos de fazer.
Tá vendo?
Tomem cuidado,
senão vocês podem estar a visualizar
a informação que você não queria.
Print.
Agora vamos verificar o que o valor
do desvio padrão do depois.
Sim, novamente
depois ou antes nós já passamos.
Esse é o valor.
Então nova aliança do depois.
É esse o valor do desvio padrão.
Depois.
Agora vamos subir aqui
e verificar o nosso script
que nós deixamos pronto aqui. Legal!
Nós já conseguimos criar,
vamos lembrar a média mediana, a moda,
a variância e o desvio padrão
para base de dados do antes e do depois.
Agora podemos dizer que a gente precisa
juntar tudo isso
para visualizar esses valores aqui.
Na verdade, seria uma impressão
de tudo que nós fizemos até agora.
Só vou apertar alguns em três aqui,
mas a última parte
são apenas duas instruções agora.
Opa, vou apagar.
Controlo
ver o que essa última parte, Rafa,
imprimindo os resultados aqui
vamos trabalhar
com todas as informações do antes
e o depois.
Vou apertar.
Então é assim simples de visualizar
o entender que está na riqueza,
entender todas essas informações.
Então o que nós temos aqui?
Olha aqui,
antes disso, aqui é um texto sempre.
Eu quero juntar um texto com valores,
eu coloco teste, aí
eu coloco a informação, lembra?
Divido por vírgula.
E o nome da variável só aqui,
na verdade é uma impressão
mostrando tudo o que nós fizemos
anteriormente.
Vamos pegar o outro script.
Poderíamos fazer aqui na mão
agora, poderíamos talvez
demorar só um pouquinho
aqui para vocês, pra gente digitar junto
para digitarmos essas informações.
Nós apertar mais alguns inteiros.
Aqui, como sempre, vou apertar muito
o que nós temos aqui
até um momento de uma revisão antes,
a média antes e esse valor média antes
e esse valor mediano
antes mediana antes.
Então, aqui nós só juntamos uma impressão
de tudo o que nós
projetamos anteriormente e aqui do depois.
E é agora que fica o que se a gente pegar
o nosso TO do nosso script,
pegamos desde uma introdução.
O que é uma análise descritiva,
duas bases de dados
com verificamos o antes e o depois,
calculamos a média mediana,
conseguimos nos achar o valor da moda
também, tanto para os dados do antes
como depois
e enfim, só voltando,
descendo um pouquinho aqui,
agora a gente consegue imprimir
e com essas informações
em mãos nós conseguimos obter os nossos
resultados.
Então aqui é o conjunto
mostrando o resultado.
Todas as informações numa impressão
só, tudo o que calculamos antes,
tudo que calculamos o depois.
E agora que você consegue fazer
a interpretação,
vamos pegar o mais simples
aqui a média de tempo de execução
do antes antes de implementar
a melhoria no algoritmo.
O tempo de execução.
Supondo que fossem segundos,
demorava 218/2.
Agora caiu para 196 e por aí vai.
Você consegue comparar o antes
e o depois de cada uma dessas informações
para saber se realmente
melhorou a performance do sistema
após a implementação
da melhoria do algoritmo?
Eu tenho certeza que vocês conseguiram
entender a importância de saber
utilizar todas essas instruções,
a linguagem R e até mesmo saber
interpretar esses resultados e.