-
Com certeza na sua vida
pessoal ou profissional
-
você já se deparou com uma situação
que você tem que verificar a performance
-
do antes e o depois de algo, como
por exemplo, no computador da sua casa.
-
Supondo que você vai
aumentar a memória RAM,
-
e ele está demorando cinco minutos
para iniciar, e aí você coloca memória RAM,
-
depois você quer verificar o quanto
melhorou, ou se melhorou,
-
então você está fazendo
uma análise do antes e o depois.
-
E a nossa linguagem R também nos ajuda
a fazer a análise do antes e o depois.
-
Só que, nesse caso, nós precisamos ter dados
que consigam fazer essa comparação.
-
Vamos trazer aqui
um exemplo para vocês.
-
Nesse exemplo, pense num caso
real da fábrica de software.
-
Nós temos lá um sistema funcionando
que vai para a produção
-
e aí descobrimos que a performance
dele não está muito boa.
-
Fizeram uma medição hora
a hora nessa nossa performance.
-
Então, após essa análise
de uma performance não tão boa,
-
melhorar o algoritmo, que é
a lógica que está dentro do sistema,
-
e, após, fazer uma nova medição.
-
É isso que vamos ver agora,
-
vamos fazer uma análise
descritiva do antes e depois
-
para vocês terem a confiança
dos dados que estão sendo analisados,
-
e até mesmo o seu resultado.
-
Vem comigo que eu vou mostrar para vocês.
-
Como sempre, eu deixo um script pronto,
não somente as linhas de execução,
-
o código do que precisamos fazer,
mas também um comentário.
-
Um breve resumo da análise
descritiva está aqui no começo.
-
Depois, se você quiser
fazer uma pausa, ler e interpretar
-
sobre o que é uma análise descritiva,
aqui fica um breve resumo.
-
Então, como nós falamos, nós
precisamos de uma base de dados
-
para poder analisar isso.
-
Vamos rodar essas duas linhas aqui,
criar os nossos dados
-
para ter esse comparativo
do antes e o depois.
-
Se pegar aqui...
-
Perdão. Vamos dar uns Enters aqui.
-
Sempre apertamos alguns Enters
para ficar uma área limpa aqui.
-
Então nós estamos criando aqui
um comentário, uma hashtag.
-
O tempo antes da performance:
hora um, hora dois, hora três.
-
Aqui nós temos quatro,
cinco, seis, sete, oito.
-
É uma análise do antes e o depois
-
em oito horas de execução
de um código, por exemplo.
-
Antes de implementar a melhoria no algoritmo,
-
e depois de implementar
a melhoria no algoritmo.
-
Vamos apertar o Enter.
-
E aí, como sempre, é legal visualizar
como estão os dados O tempo antes.
-
Apertem enter.
-
Opa, o que eu errei aqui frente a tempos?
-
Oh, tá vendo que que é isso que eu errei
o tempo antes?
-
Agora vai funcionar?
-
Então aqui tem a letra S. São tempos né?
-
Eu não tinha colocado esse intervalo.
-
Roupa not found not found
quer dizer que não existe.
-
Ai depois eu coloquei certo?
-
Então siga aquela velha dica
vocês colocam aqui print ou vocês
-
copiam o nome da variável
e coloca aqui no conjunto de dados,
-
ou você digita
e ele dá a sugestão do nome.
-
Aqui no caso ele deu a sugestão.
-
Sugestão está correta, eu vou apertar.
-
Então temos a análise do antes e o depois,
-
esse aqui facilitando a interpretação
se for verificar.
-
Como sempre estamos conjunto de valores
-
bem pequeno
para facilitar aqui a nossa análise.
-
Olhando nós já podemos
-
fazer esse resultado
Pré aviso prévio sem o R
-
Sim, o antes e o depois o depois.
-
Ficou melhor
então implementar a melhoria no algoritmo
-
e houve realmente
uma melhor performance no sistema,
-
inclusive olhando
em todas as horas de execução.
-
Realmente está melhor.
-
Agora estava eu olhando, eu consigo,
mas se fosse uma análise
-
com 300 horas de execução ia ficar bem
difícil de vocês conseguirem olhar.
-
Então vamos pedir para o R.
-
E fazer aqui para nós
o que a gente vai fazer.
-
Vamos para a próxima parte.
-
Então criamos o antes e o depois,
-
Vamos apertar mais alguns entre eles aqui.
-
Legal para facilitar nossa área,
-
nós vamos para uma próxima parte.
-
Nós vamos agora gerar todo o cenário
para calcular
-
o que as medidas descritivas para o antes.
-
Então nós vamos fazer uma análise primeiro
do antes, preparar esses dados do antes.
-
Aqui o que vamos calcular
A média simples do antes.
-
E nós vamos calcular a mediana do antes.
-
Vamos aqui, vou apertar o enter,
-
vou apertar print.
-
Oh, média aí, aqui aquela velha história
ou você copia média média
-
antes ou você
deixa ele fazer a sugestão para você.
-
Então essa é a média.
-
Se somar todos esses valores são
quatro, cinco, seis, oito valores,
-
são 08h00 de análise, somo divide por oito
e só vai ser a média.
-
E aqui nós também pedimos para calcular,
além de calcular
-
a média que acabamos de visualizar,
calcular também a mediana.
-
Vamos visualizar o valor da mediana.
-
Ô Rafa, a gente está tendo que utilizar
os conceitos que aprendemos anteriormente.
-
Sim, isso é bom, né?
-
As coisas vão se juntando
e aqui a mediana, o sinalzinho a mais.
-
Então esse é o valor da média
e esse é o valor da mediana.
-
Isso são informações
referente aos dados do antes, tudo bem?
-
Então olha, no nosso script
já aqui está o resumo para vocês.
-
Os dados do antes e o depois já criamos.
-
Nós fizemos aqui o cálculo da média
-
e da mediana já fizemos também.
-
E agora nós vamos para uma próxima parte.
-
Deixa eu copiar nessa parte do código
isolando e vamos trazer aqui para baixo.
-
Como sempre legal
apertar um pouquinho de enter
-
aqui para isolar a área do código
para poder interpretar.
-
Deixa eu
-
limpar um pouquinho aqui
para facilitar a visualização.
-
Opa, o que temos não controls aqui
-
antes se apertar o enter dá pra você
dar um control, usar legal.
-
E agora Rafa, que que nós temos?
-
Nós temos três linhas de comentário
aqui para deixar para vocês.
-
Tá lembrando?
-
Às vezes
esse é o momento que você pode dar
-
uma pausa no vídeo
antes de eu falar ou após eu falar.
-
Por que você precisa entender esses
comentários que não faz parte da execução?
-
É para.
-
Depois que você conseguir entender
essas três linhas de comentários,
-
nós poderemos fazer a execução
do que a gente precisa.
-
Vamos entender
então o que eu criei para vocês.
-
O modo underline antes
aqui é um nome de uma variável,
-
ai é sinal de menor tracinho.
-
O Rafa, já entendi.
-
O resultado daqui será armazenado
no módulo de
-
antes que a gente está fazendo.
-
Rafa, vamos aqui e primeiro
vem uma instrução aqui do R.
-
E esse ponto numérico que está deixa isso.
-
Vamos usar muito ainda dentro da linguagem
R na parte estatística, tal
-
é utilizado para converter os valores
em vetor numérico.
-
Aí você pode vira uma pergunta
na sua cabeça Mas Rafa, como assim?
-
Os dados são numéricos?
-
Mas você sabe porque o conjunto de dados?
-
Essas 08h00 são pequenos,
mas quem garante isso?
-
É sempre bom você confirmar, tá?
-
Então, voltando aqui olhando,
nós sabemos que eles são numéricos,
-
mas você tem que garantir isso
para poder fazer essa análise.
-
É isso que o ponto numérico faz.
-
Se não for algum probleminha lá
e o dado for possível de conversão
-
para numérico, ele vai ser feito
e o ponto numérico legal.
-
E aí nós vamos continuar aqui
a interpretar essa parte dessa instrução.
-
Aqui são os nomes que são os nomes
e o conjunto de valores.
-
Temos apenas um conjunto de valores.
-
Poderíamos ter mais?
-
Sim, se fosse data.frame com diversas
colunas, poderia?
-
Aqui nós temos, vamos dizer,
uma linha ou uma coluna e um exemplo
-
um pouco mais simples e aí entra aqui
no sort que seria o sort novamente.
-
Fica aqui um comentário para vocês.
-
Talvez
-
vocês já podem ter utilizado
em alguma outra linguagem de programação.
-
Quem não usou não tem problema nenhum.
-
Esse é o momento de aprender.
-
Ele é utilizado para ordenar os elementos,
porque se vocês pegarem aqui,
-
esse, por exemplo,
o primeiro aqui do antes,
-
não é obrigatório que ele esteja
numa ordem crescente ou decrescente.
-
Porque não, Rafa?
-
É uma análise na primeira hora
a demorou supondo 220/2 para executar
-
na segunda 210.
-
Então vai ser difícil se encontrar
uma coisa na ordem crescente decrescente.
-
Você está olhando algo hora a hora.
-
Como ele se comporta?
-
Então aí o que você vai fazer, tá?
-
Por isso que vem essa instrução sort.
-
E o que você vai
vai dizer é essa instrução true ou false.
-
Você colocar true.
-
Você está pedindo para que essa análise
-
seja feita numa ordem,
o que de decrescente?
-
Se você colocar false,
ele vai fazendo uma ordem
-
numa ordem crescente,
lembrando decrescente do maior
-
para o menor, que vai ser esse caso,
como ele vai analisar?
-
E se fosse crescente, do menor
para o maior?
-
Tudo bem, esse é o sort
-
bem recheado de conhecimento
aqui essa instrução.
-
E aí, o que é o tempo?
-
É o conjunto
de dados que está para ser analisado.
-
Lembrando, aqui é uma linha
só que é o tempo antes,
-
mas poderia ser um dataframe então.
-
Então esse é o conjunto de dados
que nós estamos pedindo para analisar.
-
Vamos apertar um enter.
-
E é aí que nós temos Rafa.
-
E agora é que é olhar o resultado.
-
Vamos olhar lógico, print ou você
-
copia e cola ou você digita
e deixe me dar sugestão.
-
Realmente é isso que eu quero.
-
Se eu apertar o enter,
o que ele nos trouxe de resultado, tá?
-
Essa análise foi chegou num resultado
de 210, mas o que seria esse número 210?
-
Rafa? Vamos continuar aqui.
-
Aí eu vou explicar para vocês.
-
Então aqui está o foi Introdução
Os dois dados
-
que calculamos,
a média e a mediana do antes.
-
E aqui
nós conseguimos fazer o que a moda AND
-
com o número modo que
é gerado com essa análise desses dados.
-
Nesse conjunto, de novo,
continuamos com o intervalo
-
de valores do antes
ainda não fizemos o depois.
-
Vamos continuar aí.
-
Aqui nós vamos pôr uma outra parte
do nosso código aqui na nossa análise.
-
Vou copiar a descer lá para baixo
um pouquinho
-
novamente aquela velha dica, se possível,
-
quer que eu, que estou transmitindo
conhecimento para vocês?
-
Se você quiser, não precisa apertar muito,
mas é legal para vocês dividirem
-
por partes. Essa análise tá?
-
Aqui novamente, tem um resto,
-
é só limpar o código aqui para depois
quando executá lo acontecer.
-
Nenhum erro
-
legal aqui eu deixo esse comentário.
-
Aí nós podemos verificar o que a variância
que é a variância deixo aqui.
-
É uma medida estatística
que indica a dispersão dos valores
-
em relação à média.
-
Nós não temos a média o quanto os valores,
que valores,
-
o quanto cada um desses valores
estão distantes da média.
-
Por isso que nós fizemos aqui.
-
Essa não é a média, deu 218 a seu olhar.
-
Aqui me parece, por exemplo,
qual que está mais distante,
-
olhando aqui, interpretando.
-
Mas você vai deixar o contador
fazer por nós?
-
Talvez seja esse
qual tá mais perto de 218.
-
Olhando aqui o valor 220 Tá,
-
mas deixa o computador falar pra nós
o uso desse intervalo de valores.
-
Quais estão mais perto
ou menos perto da média?
-
Quanto maior a variância,
-
mais dispersos os dados estão, ou seja,
-
o valor do resultado da variação
que nós vamos pedir para calcular.
-
Agora
-
que quanto
-
mais, quanto maior o número,
mais distante estará da média.
-
Então tem uma disparidade aí,
uma distância aí da média dos dados.
-
Aí vamos executar para executar.
-
Como sempre, eu vou apertar um entre
aqui e aí nós vamos analisar o variância
-
antes queremos encontrar
como que eu acho o valor da variância,
-
porque é isso que a gente acabou
de explicar aqui.
-
E novamente,
é mérito você fazer uma pausa, anotar,
-
verificar o material
que está disponível para vocês, escrito,
-
escrito para você
depois conseguir executar aqui.
-
Então aqui como que eu consigo armazenar
o valor da variância
-
do tempo
do conjunto de dados tempos antes?
-
Como que eu consigo pedir
para ele achar a variância aqui?
-
É simples, depois que você entendeu,
o conceito é simples
-
você cria uma variável, nesse caso
ela de variância antes, onde antes?
-
Aqui eu coloca a instrução que é var
-
v a r é o nome do conjunto de dados.
-
Eu quero dar
-
uma olhadinha aqui e dar uma olhadinha
já antecipado.
-
Podemos não ter problema na variância
-
antes não, é só apertar o enter,
-
nós conseguimos saber qual que é o valor,
o resultado da variância.
-
Tá, e aí?
-
Agora o desvio padrão desvio padrão,
vocês já tem esse conhecimento?
-
Como calcular o desvio padrão?
-
Vamos criar uma variável desvio padrão
antes que nós estamos analisando,
-
antes da implementação
da melhoria do algoritmo
-
e se a instrução é qualquer
o conjunto de dados.
-
Rafa,
podemos visualizar lógico que podemos.
-
Qual que é o nome da variável desvio
-
padrão antes?
-
Legal.
-
E aqui nós temos o desvio padrão para esse
-
conjunto de valores é 7,03.
-
Agora que conseguimos encontrar o valor
-
da variância
-
e também do desvio padrão, vamos continuar
-
para conseguir concluir a análise
que queremos do antes e o depois.
-
Então, o que nós já vimos?
-
Retomando essa parte, criamos os dados,
criamos a média
-
e a mediana do do antes,
-
conseguimos achar a moda,
-
acabamos de conseguir descobrir
a variância e o desvio padrão.
-
Agora vamos para essa
próxima parte da análise.
-
Vou copiar aqui para baixo aqui.
-
Como sempre, eu vou apertar alguns pontos
-
para facilitar aqui para vocês
a visualização.
-
Um Vou apertaram Control v.
-
Deixa eu arrumar aqui
para explicar o que nós vamos fazer agora
-
calculando
medidas descritivas para o depois.
-
Agora fizemos o antes,
vamos para o depois.
-
Agora nós iremos repetir o script
que nós fizemos anteriormente
-
para a parte da execução do antes.
-
Agora iremos fazer depois.
-
Lembre se do cenário do case.
-
Tem um sistema que ele não estava
com uma performance de algoritmo tão boa,
-
então fizeram uma análise
extrair os tempos de execução
-
antes da implementação da melhoria
no algoritmo.
-
E aí precisava
se agora fazer uma análise do depois.
-
Então no depois nós temos a base de dados.
-
Como está a performance?
-
Dois Depois e agora o R
vai verificar o antes e o depois.
-
Para fazer esse comparativo
e conseguir ter uma análise descritiva,
-
fizemos para o antes.
-
Vamos fazer a mesma coisa agora
para o conjunto de dados do depois vem
-
aqui comigo.
-
Então, como sempre discutindo aqui,
eu deixo um comentário para vocês,
-
calculando medidas descritivas para depois
-
nós iremos achar a média,
a média de quem alpha.
-
Lembre se. Agora
-
vamos trabalhar com essa base de dados,
a performance do algoritmo do depois.
-
Então vamos descer um pouquinho.
-
Nós estamos aqui cria uma variável
chamado média depois esse é o nome.
-
Esse é o nome da base de dados
e vamos também achar os valores.
-
O valor da mediana.
-
Se eu apertar um entra aqui é sempre legal
visualizar o resultado,
-
a média depois e o depois.
-
Vou apertar o enter.
-
Então essa é a média
da performance do depois.
-
E agora nós vamos achar também
o valor da mediana Visualizar.
-
Perdão, nós já temos o valor 20
-
mediano, não underline.
-
Depois vou apertar o então.
-
Então essa é a média e essa é a mediana do
depois vou subir aqui,
-
vamos pegar o nosso script, tá?
-
Já fizemos antes, agora
-
nós estamos calculando tudo,
depois vamos achar agora o valor da moda
-
é a mesma coisa
-
que nós fizemos do antes,
só que agora é a moda para depois.
-
Vamos apertar alguns enter
para ficar limpa a hora
-
que nossa de programação
poder entender criar a variável modo
-
e logo depois depois as numeric len serve
serve para converter os valores
-
numérico, por mais que estão ali, mas
é bom confirmar que os valores existam.
-
São um número, eles estão como número.
-
E aqui nós temos a parte da organização
dos dados em ordem decrescente.
-
E aqui, qual que é o conjunto de dados aí
que vai ser feita essa moda?
-
O valor da moda, se eu apertar o enter
é igualzinho anterior,
-
só muda que
agora nós estamos fazendo a análise
-
para os dados do depois,
porque após implementação do algoritmo,
-
então a moda para o depois de um valor
resultou em um valor de 190.
-
Vamos voltar mais um pouquinho aqui
de pegar o script que nós deixamos
-
a palavra pré pronto e pronto
-
e vamos verificar o já geramos a moda
-
e agora nós vamos criar,
que é a variância, é o desvio padrão.
-
Vamos descobrir
qual é o valor da variância
-
e qual o valor do desvio padrão para o
depois e de apertar novamente alguns.
-
Então
-
vou dar um control v se eu só limpar aqui,
-
se a gente executar com esse tracinho
aqui vai vai ocorrer um erro.
-
Então o que nós temos aqui?
-
Criamos uma variável chamada variância.
-
Depois aqui a instrução para calcular
a variância dessa base de dados
-
utilizando o VAR e o desvio padrão.
-
Vou apertar enter.
-
A gente esperava que dá certo.
-
E aqui vamos só visualizar
para confirmar que deu certo.
-
Visualizou?
-
E agora vamos verificar
o valor do desvio padrão que foi
-
encontrado.
-
Desvio padrão
depois ou pode ter um errinho aqui?
-
Pessoal, cuidado aqui eu visualizei
o antes, não era o antes e sim o depois.
-
Vamos ver.
-
Oh, então aqui o print é um erro.
-
Não é um erro do script que a gente criou.
-
Tais sim, na hora de visualizar o depois.
-
Oh, então essa é a variância
do que tínhamos feito anteriormente.
-
E agora esse erro
depois que acabamos de fazer.
-
Tá vendo?
-
Tomem cuidado,
-
senão vocês podem estar a visualizar
a informação que você não queria.
-
Print.
-
Agora vamos verificar o que o valor
do desvio padrão do depois.
-
Sim, novamente
depois ou antes nós já passamos.
-
Esse é o valor.
-
Então nova aliança do depois.
-
É esse o valor do desvio padrão.
-
Depois.
-
Agora vamos subir aqui
e verificar o nosso script
-
que nós deixamos pronto aqui. Legal!
-
Nós já conseguimos criar,
-
vamos lembrar a média mediana, a moda,
-
a variância e o desvio padrão
para base de dados do antes e do depois.
-
Agora podemos dizer que a gente precisa
juntar tudo isso
-
para visualizar esses valores aqui.
-
Na verdade, seria uma impressão
de tudo que nós fizemos até agora.
-
Só vou apertar alguns em três aqui,
mas a última parte
-
são apenas duas instruções agora.
-
Opa, vou apagar.
-
Controlo
ver o que essa última parte, Rafa,
-
imprimindo os resultados aqui
vamos trabalhar
-
com todas as informações do antes
e o depois.
-
Vou apertar.
-
Então é assim simples de visualizar
-
o entender que está na riqueza,
entender todas essas informações.
-
Então o que nós temos aqui?
-
Olha aqui,
antes disso, aqui é um texto sempre.
-
Eu quero juntar um texto com valores,
eu coloco teste, aí
-
eu coloco a informação, lembra?
-
Divido por vírgula.
-
E o nome da variável só aqui,
na verdade é uma impressão
-
mostrando tudo o que nós fizemos
anteriormente.
-
Vamos pegar o outro script.
-
Poderíamos fazer aqui na mão
agora, poderíamos talvez
-
demorar só um pouquinho
aqui para vocês, pra gente digitar junto
-
para digitarmos essas informações.
-
Nós apertar mais alguns inteiros.
-
Aqui, como sempre, vou apertar muito
o que nós temos aqui
-
até um momento de uma revisão antes,
-
a média antes e esse valor média antes
-
e esse valor mediano
-
antes mediana antes.
-
Então, aqui nós só juntamos uma impressão
de tudo o que nós
-
projetamos anteriormente e aqui do depois.
-
E é agora que fica o que se a gente pegar
o nosso TO do nosso script,
-
pegamos desde uma introdução.
-
O que é uma análise descritiva,
-
duas bases de dados
com verificamos o antes e o depois,
-
calculamos a média mediana,
conseguimos nos achar o valor da moda
-
também, tanto para os dados do antes
como depois
-
e enfim, só voltando,
descendo um pouquinho aqui,
-
agora a gente consegue imprimir
e com essas informações
-
em mãos nós conseguimos obter os nossos
resultados.
-
Então aqui é o conjunto
-
mostrando o resultado.
-
Todas as informações numa impressão
-
só, tudo o que calculamos antes,
tudo que calculamos o depois.
-
E agora que você consegue fazer
a interpretação,
-
vamos pegar o mais simples
aqui a média de tempo de execução
-
do antes antes de implementar
a melhoria no algoritmo.
-
O tempo de execução.
-
Supondo que fossem segundos,
demorava 218/2.
-
Agora caiu para 196 e por aí vai.
-
Você consegue comparar o antes
e o depois de cada uma dessas informações
-
para saber se realmente
-
melhorou a performance do sistema
-
após a implementação
da melhoria do algoritmo?
-
Eu tenho certeza que vocês conseguiram
-
entender a importância de saber
utilizar todas essas instruções,
-
a linguagem R e até mesmo saber
interpretar esses resultados e.