< Return to Video

DSCR CAP03 2024 VA04 ESTUDO DE CASO ANALISE DESCRITIVA

  • 0:08 - 0:11
    Com certeza na sua vida
    pessoal ou profissional
  • 0:11 - 0:16
    você já se deparou com uma situação
    que você tem que verificar a performance
  • 0:16 - 0:21
    do antes e o depois de algo, como
    por exemplo, no computador da sua casa.
  • 0:21 - 0:24
    Supondo que você vai
    aumentar a memória RAM
  • 0:24 - 0:27
    porque ele está demorando
    cinco minutos para iniciar,
  • 0:27 - 0:29
    e aí você coloca uma memória RAM,
  • 0:29 - 0:33
    e depois você quer verificar
    o quanto melhorou, ou se melhorou.
  • 0:33 - 0:36
    Então você está fazendo
    uma análise do antes e o depois.
  • 0:36 - 0:40
    E a nossa linguagem R também nos ajuda
    a fazer a análise do antes e o depois.
  • 0:40 - 0:46
    Só que, nesse caso, nós precisamos ter dados
    que consigam fazer essa comparação.
  • 0:46 - 0:48
    Vamos trazer aqui
    um exemplo para vocês.
  • 0:48 - 0:52
    Nesse exemplo, pense num caso
    real de uma fábrica de software.
  • 0:52 - 0:56
    Nós temos lá um sistema funcionando
    que vai para a produção
  • 0:56 - 0:59
    e aí descobrimos que a performance
    dele não está muito boa.
  • 0:59 - 1:03
    Fizeram uma medição hora
    a hora nessa performance.
  • 1:03 - 1:08
    Então, após essa análise
    de uma performance não tão boa,
  • 1:08 - 1:12
    melhorar o algoritmo, que é
    a lógica que está dentro do sistema,
  • 1:12 - 1:15
    e, após, fazer uma nova medição.
  • 1:15 - 1:16
    É isso que vamos ver agora,
  • 1:16 - 1:19
    vamos fazer uma análise
    descritiva do antes e depois
  • 1:19 - 1:23
    para vocês terem a confiança
    dos dados que estão sendo analisados,
  • 1:23 - 1:24
    e até mesmo o seu resultado.
  • 1:24 - 1:26
    Vem comigo que eu vou mostrar para vocês.
  • 1:26 - 1:32
    Como sempre, eu deixo um script pronto,
    não somente as linhas de execução,
  • 1:32 - 1:36
    o código do que precisamos fazer,
    mas também um comentário.
  • 1:36 - 1:40
    Um breve resumo da análise
    descritiva está aqui no começo.
  • 1:40 - 1:45
    Depois, se você quiser
    fazer uma pausa, ler e interpretar
  • 1:45 - 1:49
    sobre o que é uma análise descritiva,
    aqui fica um breve resumo.
  • 1:49 - 1:53
    Então, como nós falamos, nós
    precisamos de uma base de dados
  • 1:53 - 1:54
    para poder analisar isso.
  • 1:54 - 1:58
    Vamos rodar essas duas linhas aqui,
    criar os nossos dados
  • 1:58 - 2:01
    para ter esse comparativo
    do antes e do depois.
  • 2:02 - 2:04
    Se pegar aqui...
  • 2:04 - 2:05
    Perdão. Vamos dar uns Enters aqui.
  • 2:05 - 2:09
    Sempre apertamos alguns Enters
    para ficar uma área limpa aqui.
  • 2:09 - 2:13
    Então nós estamos criando aqui
    um comentário, uma hashtag.
  • 2:13 - 2:18
    O tempo antes da performance:
    hora um, hora dois, hora três.
  • 2:18 - 2:22
    Aqui nós temos quatro,
    cinco, seis, sete, oito.
  • 2:22 - 2:24
    É uma análise do antes e do depois
  • 2:24 - 2:28
    em oito horas de execução
    de um código, por exemplo.
  • 2:28 - 2:31
    Antes de implementar
    a melhoria no algoritmo,
  • 2:31 - 2:34
    e depois de implementar
    a melhoria no algoritmo.
  • 2:34 - 2:36
    Vamos apertar o Enter.
  • 2:36 - 2:40
    E aí, como sempre, é legal visualizar
    como estão os dados.
  • 2:40 - 2:43
    Olhe, tempo antes... Aperte o Enter.
  • 2:43 - 2:45
    Opa, o que eu errei aqui?
  • 2:45 - 2:46
    Print...
  • 2:46 - 2:48
    Ah, "tempos", está vendo?
  • 2:48 - 2:50
    O que eu errei?
  • 2:50 - 2:51
    "tempo_antes"...
  • 2:51 - 2:53
    Agora vai funcionar.
  • 2:53 - 2:54
    Aqui tem a letra "s".
  • 2:54 - 2:56
    São tempos, né?
  • 2:56 - 2:59
    Eu não tinha colocado o "s",
    então ele falou: "Opa! Not found".
  • 2:59 - 3:01
    Not found quer dizer que não existe.
  • 3:01 - 3:03
    Ai depois eu coloquei certo.
  • 3:03 - 3:06
    Então sigam aquela velha dica, né,
    ou vocês colocam aqui print,
  • 3:06 - 3:12
    vocês copiam o nome da variável
    e colocam aqui no conjunto de dados,
  • 3:12 - 3:17
    ou você digita, e ele dá
    a sugestão do nome.
  • 3:17 - 3:18
    Aqui, no caso, ele deu a sugestão.
  • 3:18 - 3:21
    A sugestão está correta, eu vou apertar.
  • 3:21 - 3:25
    Então temos a análise do antes e o depois.
  • 3:25 - 3:29
    Facilitando a interpretação
    aqui, se formos verificar,
  • 3:29 - 3:33
    como sempre temos um conjunto
    de valores bem pequeno
  • 3:33 - 3:35
    para facilitar a nossa análise.
  • 3:36 - 3:41
    Olhando, nós já podemos fazer
    esse resultado prévio sem o R.
  • 3:41 - 3:44
    O antes e o depois, o depois ficou melhor.
  • 3:44 - 3:47
    Então implementou-se
    a melhoria no algoritmo,
  • 3:47 - 3:51
    e houve realmente uma melhor
    performance no sistema.
  • 3:51 - 3:56
    Inclusive, olhando em todas as horas
    de execução, realmente está melhor.
  • 3:56 - 3:58
    Eu, olhando, consigo.
  • 3:58 - 4:02
    Mas se fosse uma análise
    com 300 horas de execução,
  • 4:02 - 4:06
    iria ficar bem difícil vocês
    conseguirem olhando.
  • 4:06 - 4:09
    Então vamos pedir para o R fazer para nós.
  • 4:09 - 4:10
    O que vamos fazer?
  • 4:10 - 4:12
    Vamos para a próxima parte.
  • 4:12 - 4:15
    Então criamos o antes e o depois.
  • 4:15 - 4:17
    Vamos apertar mais alguns Enters aqui.
  • 4:17 - 4:20
    É sempre legal para facilitar a nossa área.
  • 4:20 - 4:23
    Vamos para uma próxima parte.
  • 4:23 - 4:26
    Nós vamos agora gerar todo o cenário
  • 4:26 - 4:31
    para calcular as medidas
    descritivas para o antes.
  • 4:31 - 4:35
    Então nós vamos fazer primeiro uma análise
    do antes, preparar esses dados do antes.
  • 4:35 - 4:40
    Aqui nós vamos calcular
    a média simples do antes,
  • 4:40 - 4:44
    e vamos calcular a mediana do antes.
  • 4:44 - 4:45
    Vamos aqui?
  • 4:45 - 4:49
    Eu vou apertar o Enter, vou apertar print.
  • 4:49 - 4:51
    Olhe, média...
  • 4:51 - 4:55
    Aí aqui, aquela velha história,
    ou você copia "media_antes",
  • 4:55 - 4:58
    ou você o deixa fazer
    a sugestão para você.
  • 4:58 - 5:00
    Então essa é a média.
  • 5:00 - 5:05
    Se somar todos esses valores,
    são quatro, cinco, seis, oito valores,
  • 5:05 - 5:06
    são oito horas de análise,
  • 5:06 - 5:10
    somo e divido por oito, vai ser a média.
  • 5:10 - 5:14
    Além de calcular a média
    que acabamos de visualizar,
  • 5:14 - 5:17
    nós também pedimos
    para calcular a mediana.
  • 5:17 - 5:19
    Vamos visualizar o valor da mediana?
  • 5:20 - 5:24
    "Ô, Rafa, estamos tendo que utilizar
    os conceitos que aprendemos anteriormente."
  • 5:24 - 5:25
    Sim. Isso é bom, né?
  • 5:25 - 5:28
    As coisas vão se juntando.
  • 5:28 - 5:29
    E aqui a mediana.
  • 5:29 - 5:31
    Opa, um sinalzinho a mais.
  • 5:31 - 5:34
    Então esse é o valor da média
    e esse é o valor da mediana.
  • 5:34 - 5:39
    São informações referentes
    aos dados do antes, tudo bem?
  • 5:39 - 5:43
    Então está aqui o nosso script,
    o resumo para vocês.
  • 5:43 - 5:48
    Já criamos os dados do antes e do depois,
  • 5:48 - 5:53
    já fizemos aqui o cálculo
    da média e da mediana.
  • 5:53 - 5:55
    Então já fizemos também.
  • 5:55 - 5:57
    E agora nós vamos para uma próxima parte.
  • 5:57 - 6:02
    Eu estou copiando essa parte do código,
    isolando-o, e vamos trazer aqui para baixo.
  • 6:02 - 6:05
    Como sempre, é legal apertar
    um pouquinho de Enter aqui
  • 6:05 - 6:08
    para isolar a área do código
    para podermos interpretar.
  • 6:10 - 6:13
    Deixe-me limpar um pouquinho aqui
    para facilitar a visualização.
  • 6:13 - 6:14
    Opa!
  • 6:14 - 6:17
    Damos um Control + Z aqui.
  • 6:17 - 6:19
    Antes de apertar o Enter,
    você dá um Control + Z.
  • 6:21 - 6:23
    "E agora, Rafa, o que nós temos?"
  • 6:23 - 6:28
    Nós temos três linhas de comentário
    aqui para deixar para vocês, tá?
  • 6:28 - 6:31
    Lembrando que às vezes esse é o momento
    que você pode dar uma pausa no vídeo,
  • 6:31 - 6:34
    antes de eu falar ou após eu falar.
  • 6:34 - 6:39
    Por quê? Porque você precisa entender esses
    comentários, que não fazem parte da execução.
  • 6:39 - 6:44
    E depois que conseguirmos entender
    essas três linhas de comentários,
  • 6:44 - 6:47
    poderemos fazer a execução
    do que precisamos.
  • 6:47 - 6:48
    Vamos entender?
  • 6:48 - 6:50
    O que eu criei para vocês então?
  • 6:50 - 6:52
    O "moda_antes".
  • 6:52 - 6:54
    É o nome de uma variável.
  • 6:54 - 6:55
    Aí sinal de menor, tracinho.
  • 6:55 - 6:57
    "Ô, Rafa, eu já entendi.
  • 6:57 - 7:01
    O resultado daqui será
    armazenado no moda_antes.
  • 7:01 - 7:03
    Mas o que nós estamos fazendo, Rafa?"
  • 7:03 - 7:04
    Vamos aqui.
  • 7:04 - 7:09
    Primeiro vem uma instrução
    aqui do R, "as.numeric".
  • 7:09 - 7:10
    O que é isso?
  • 7:10 - 7:15
    Vocês ainda vão usar muito dentro
    da linguagem R na parte de estatística.
  • 7:15 - 7:19
    "É utilizado para converter
    os valores em vetor numérico."
  • 7:19 - 7:23
    Aí pode vir uma pergunta na sua cabeça:
  • 7:23 - 7:24
    "Mas, Rafa, como assim?
  • 7:24 - 7:26
    Os dados são numéricos."
  • 7:26 - 7:31
    Você sabe porque o conjunto de dados,
    essas oito horas, é pequeno.
  • 7:31 - 7:33
    Mas quem garante isso?
  • 7:33 - 7:36
    É sempre bom você confirmar, tá?
  • 7:36 - 7:39
    Então, voltando aqui, olhando,
    nós sabemos que eles são numéricos,
  • 7:39 - 7:43
    mas você tem que garantir isso
    para poder fazer essa análise.
  • 7:43 - 7:46
    É isso que o as.numeric faz.
  • 7:46 - 7:48
    Se não for, tiver algum probleminha lá
  • 7:48 - 7:50
    e o dado for possível
    de conversão para numérico,
  • 7:50 - 7:52
    ele vai ser feito, é o as.numeric.
  • 7:54 - 7:58
    E aí nós vamos continuar aqui
    a interpretar essa parte dessa instrução.
  • 7:59 - 8:00
    Aqui são os nomes.
  • 8:00 - 8:01
    O que são os nomes?
  • 8:01 - 8:03
    É o conjunto de valores.
  • 8:03 - 8:05
    Nós temos apenas um conjunto de valores.
  • 8:05 - 8:06
    Poderíamos ter mais?
  • 8:06 - 8:07
    Sim.
  • 8:07 - 8:09
    Se fosse um dataframe
    com diversas colunas? Poderia.
  • 8:09 - 8:13
    Aqui nós temos uma linha, ou uma coluna.
  • 8:13 - 8:15
    É um exemplo um pouco mais simples.
  • 8:15 - 8:17
    E aí você entra aqui no "sort".
  • 8:17 - 8:18
    O que seria o sort?
  • 8:18 - 8:22
    Novamente, fica aqui
    um comentário para vocês.
  • 8:22 - 8:26
    Talvez vocês já tenham utilizado
    em alguma outra linguagem de programação.
  • 8:26 - 8:28
    Quem não usou, não
    tem problema nenhum, tá?
  • 8:28 - 8:30
    Esse é o momento de aprender.
  • 8:30 - 8:34
    Ele é utilizado para ordenar os elementos.
  • 8:34 - 8:39
    Porque se vocês pegarem aqui,
    esse primeiro aqui do antes,
  • 8:39 - 8:42
    não é obrigatório que ele esteja
    numa ordem crescente ou decrescente.
  • 8:42 - 8:43
    "Por que não, Rafa?"
  • 8:43 - 8:44
    É uma análise.
  • 8:44 - 8:49
    Supondo que, na primeira hora,
    demorou 220 segundos para executar,
  • 8:49 - 8:50
    na segunda, 210.
  • 8:50 - 8:54
    Então vai ser difícil você encontrar
    na ordem crescente ou decrescente.
  • 8:54 - 8:58
    Você está olhando hora a hora
    como ele se comporta.
  • 8:58 - 9:00
    O que você vai fazer então?
  • 9:00 - 9:03
    Por isso que vem essa instrução sort.
  • 9:03 - 9:07
    Você vai dizer que, nessa
    instrução true ou false,
  • 9:07 - 9:12
    se você colocar true, você está
    pedindo para que essa análise
  • 9:12 - 9:16
    seja feita numa ordem decrescente.
  • 9:16 - 9:21
    Se você colocar false, ele vai
    fazer numa ordem crescente.
  • 9:21 - 9:23
    Lembrando que, decrescente,
    do maior para o menor,
  • 9:23 - 9:25
    que vai ser como ele
    vai analisar esse caso.
  • 9:25 - 9:31
    E se fosse crescente,
    do menor para o maior.
  • 9:31 - 9:33
    Esse é o sort.
  • 9:33 - 9:36
    Bem recheada de conhecimento
    essa instrução aqui.
  • 9:36 - 9:39
    E o que é o "table"?
  • 9:39 - 9:42
    É o conjunto de dados para ser analisado.
  • 9:42 - 9:46
    Lembrando, aqui é uma linha
    só, que é o "tempo_antes",
  • 9:46 - 9:48
    mas poderia ser um dataframe.
  • 9:48 - 9:52
    Então esse é o conjunto de dados
    que nós estamos pedindo para analisar.
  • 9:53 - 9:54
    Vamos apertar um Enter.
  • 9:55 - 9:56
    E aí, o que nós temos?
  • 9:56 - 9:58
    "Rafa, e agora?"
  • 9:58 - 9:59
    Quer olhar o resultado?
  • 9:59 - 10:00
    Vamos olhar, lógico.
  • 10:00 - 10:01
    "print"...
  • 10:01 - 10:06
    Ou você copia e cola, ou você
    digita, e deixa ele dar a sugestão.
  • 10:06 - 10:08
    Realmente é esse que eu quero.
  • 10:08 - 10:13
    Se eu apertar o Enter,
    o que ele nos trouxe de resultado?
  • 10:13 - 10:17
    Essa análise chegou num resultado de 210.
  • 10:17 - 10:20
    Mas o que seria esse número 210?
  • 10:20 - 10:23
    Vamos continuar aqui, aí
    eu vou explicar para vocês.
  • 10:23 - 10:26
    Aqui foi a introdução, os dois dados,
  • 10:26 - 10:30
    calculamos a média e a mediana do antes.
  • 10:30 - 10:33
    E aqui, nós conseguimos fazer a moda,
  • 10:33 - 10:38
    qual o número moda que é gerado com essa
    análise desses dados, desse conjunto.
  • 10:38 - 10:42
    De novo, continuamos
    com o intervalo de valores do antes.
  • 10:42 - 10:44
    Ainda não fizemos o depois.
  • 10:44 - 10:46
    Vamos continuar?
  • 10:46 - 10:51
    Aqui nós vamos para uma outra parte
    do nosso código, da nossa análise.
  • 10:51 - 10:55
    Eu vou copiar e descer um pouquinho.
  • 10:56 - 10:59
    Novamente, aquela
    velha dica: se possível...
  • 10:59 - 11:02
    É que aqui, eu que estou transmitindo
    conhecimento para vocês.
  • 11:02 - 11:04
    Se você quiser, não
    precisa apertar o Enter.
  • 11:04 - 11:08
    Mas é legal para vocês dividirem
    por partes essa análise, tá?
  • 11:08 - 11:10
    Aqui, novamente, tem uma hashtag.
  • 11:10 - 11:12
    Deixe-me só limpar o código aqui,
  • 11:12 - 11:15
    para quando executá-lo depois,
    não acontecer nenhum erro.
  • 11:17 - 11:18
    Aqui eu deixo esse comentário, né?
  • 11:18 - 11:21
    Nós iremos verificar a variância.
  • 11:21 - 11:22
    O que é a variância?
  • 11:22 - 11:25
    Está aqui, olhe:
    "É uma medida estatística
  • 11:25 - 11:28
    que indica a dispersão
    dos valores em relação à média".
  • 11:28 - 11:30
    Nós não temos a média?
  • 11:30 - 11:32
    O quanto os valores...
  • 11:32 - 11:33
    "Que valores, Rafa?"
  • 11:33 - 11:38
    O quanto cada um desses valores
    está distante da média.
  • 11:38 - 11:40
    Por isso que nós fizemos aqui, olhe.
  • 11:40 - 11:42
    Essa não é a média?
  • 11:42 - 11:43
    Deu 218.
  • 11:43 - 11:47
    Se eu olhar aqui, me parece...
  • 11:47 - 11:50
    Olhando aqui, interpretando, qual
    parece que está mais distante?
  • 11:50 - 11:52
    Mas não vamos deixar
    o computador fazer por nós, né?
  • 11:52 - 11:53
    Talvez seja esse.
  • 11:53 - 11:56
    Qual está mais perto de 218?
  • 11:56 - 12:00
    Olhando aqui, o valor 220, tá?
  • 12:00 - 12:02
    Mas deixe que o computador nos fale.
  • 12:02 - 12:08
    Nesse intervalo de valores, quais estão
    mais perto ou menos perto da média?
  • 12:08 - 12:14
    Quanto maior a variância,
    mais dispersos os dados estão.
  • 12:14 - 12:20
    Ou seja, o valor do resultado da variância
    que nós vamos pedir para calcular agora,
  • 12:20 - 12:25
    quanto maior o número,
    mais distante estará da média.
  • 12:25 - 12:30
    Então tem uma disparidade aí,
    uma distância da média dos dados.
  • 12:30 - 12:32
    Aí vamos executar.
  • 12:32 - 12:36
    Como sempre, para executar,
    eu vou apertar um Enter aqui,
  • 12:36 - 12:39
    e aí nós vamos analisar,
    olhe: variancia_antes,
  • 12:39 - 12:42
    nós queremos saber como
    eu acho o valor da variância,
  • 12:42 - 12:45
    que é isso que acabamos de explicar aqui.
  • 12:45 - 12:50
    E, novamente, é melhor
    você fazer uma pausa, anotar,
  • 12:50 - 12:53
    verificar o material escrito
    que está disponível para vocês
  • 12:53 - 12:56
    para depois você conseguir executar aqui.
  • 12:56 - 13:01
    Então, aqui, como eu consigo
    armazenar o valor da variância
  • 13:01 - 13:05
    do conjunto de dados tempos_antes,
  • 13:06 - 13:10
    como eu consigo pedir
    para ele achar a variância aqui.
  • 13:10 - 13:11
    É simples.
  • 13:11 - 13:14
    Depois que você entendeu
    o conceito, é simples.
  • 13:14 - 13:19
    Você cria uma variável, que, nesse caso,
    eu chamei de "variancia_antes".
  • 13:19 - 13:23
    Aqui eu coloco a instrução,
    que é "var", v-a-r,
  • 13:23 - 13:25
    e o nome do conjunto de dados.
  • 13:25 - 13:27
    "Ah, Rafa, eu quero dar uma olhadinha".
  • 13:27 - 13:29
    Já quer dar uma olhadinha?
  • 13:29 - 13:31
    Podemos, não tem problema não.
  • 13:31 - 13:34
    Olhe, "variancia_antes", não é isso?
  • 13:34 - 13:41
    Se apertarmos o Enter, conseguiremos saber
    qual é o valor, o resultado da variância.
  • 13:41 - 13:44
    Agora o desvio-padrão.
  • 13:44 - 13:47
    O desvio-padrão, vocês já
    têm esse conhecimento.
  • 13:47 - 13:49
    Como calcular o desvio-padrão?
  • 13:49 - 13:50
    Vamos criar uma variável.
  • 13:50 - 13:54
    Desvio-padrão antes,
    porque nós estamos analisando
  • 13:54 - 13:57
    antes da implementação
    da melhoria do algoritmo,
  • 13:57 - 14:00
    "sd" é a instrução, e qual
    é o conjunto de dados.
  • 14:00 - 14:03
    "Rafa, podemos visualizar?"
  • 14:03 - 14:04
    Lógico que podemos.
  • 14:04 - 14:06
    Qual é o nome da variável?
  • 14:06 - 14:08
    "desvio_padrao_antes".
  • 14:09 - 14:11
    Legal.
  • 14:11 - 14:17
    E aqui nós temos que o desvio-padrão
    para esse conjunto de valores é 7.03.
  • 14:17 - 14:24
    Agora que conseguimos encontrar o valor
    da variância e do desvio-padrão,
  • 14:24 - 14:29
    vamos continuar para conseguir concluir
    a análise que queremos do antes e o depois.
  • 14:29 - 14:30
    Então, o que nós já vimos?
  • 14:30 - 14:33
    Retomamos essa parte, criamos os dados,
  • 14:33 - 14:38
    criamos a média e a mediana do antes,
  • 14:38 - 14:41
    conseguimos achar a moda,
  • 14:41 - 14:46
    acabamos de descobrir
    a variância e o desvio-padrão.
  • 14:46 - 14:48
    Agora vamos para essa
    próxima parte da análise.
  • 14:48 - 14:51
    Vou copiar aqui para baixo.
  • 14:51 - 14:55
    Aqui, como sempre, eu
    vou apertar alguns Enters
  • 14:55 - 14:58
    para facilitar para vocês a visualização.
  • 14:58 - 15:00
    Vou apertar um Control + V.
  • 15:00 - 15:03
    Deixe-me arrumar aqui para explicar.
  • 15:03 - 15:04
    O que nós vamos fazer agora então?
  • 15:04 - 15:09
    Olhe, "calculando medidas
    descritivas para depois" agora, né?
  • 15:09 - 15:12
    Fizemos o antes, vamos para o depois.
  • 15:12 - 15:16
    Agora nós iremos repetir o script
    que nós fizemos anteriormente
  • 15:16 - 15:19
    para a parte da execução do antes.
  • 15:19 - 15:21
    Agora nós iremos fazer para o depois.
  • 15:21 - 15:24
    Lembre-se do cenário, do case.
  • 15:24 - 15:29
    Tem um sistema que não estava
    com uma performance tão boa de algoritmo.
  • 15:29 - 15:33
    Então fizeram uma análise,
    extraíram os tempos de execução
  • 15:33 - 15:36
    antes da implementação
    da melhoria no algoritmo,
  • 15:36 - 15:40
    e aí precisava-se fazer
    uma análise do depois.
  • 15:40 - 15:42
    Então, no depois, nós
    temos a base de dados,
  • 15:42 - 15:45
    como está a performance do depois,
  • 15:45 - 15:48
    e agora o R vai verificar
    o antes e o depois
  • 15:48 - 15:53
    para fazer esse comparativo
    e conseguir ter uma análise descritiva.
  • 15:53 - 15:56
    Fizemos para o antes, vamos
    fazer a mesma coisa agora
  • 15:56 - 15:58
    para o conjunto de dados do depois.
  • 15:58 - 15:59
    Vem aqui comigo.
  • 15:59 - 16:04
    Então, como sempre, eu deixo
    um comentário para vocês.
  • 16:04 - 16:08
    Olhe, calculando medidas
    descritivas para depois.
  • 16:08 - 16:10
    Nós iremos achar a média.
  • 16:10 - 16:12
    A média de quem?
  • 16:12 - 16:16
    Lembre-se, agora nós vamos
    trabalhar com essa base de dados,
  • 16:16 - 16:19
    a performance do algoritmo do depois.
  • 16:19 - 16:21
    Então vamos descer um pouquinho.
  • 16:21 - 16:23
    Estamos aqui.
  • 16:23 - 16:25
    Criei uma variável
    chamada "media_depois".
  • 16:25 - 16:28
    Esse é o nome da base de dados.
  • 16:28 - 16:32
    E vamos também achar o valor da mediana.
  • 16:32 - 16:33
    Se eu apertar o Enter aqui...
  • 16:33 - 16:38
    É sempre legal visualizar
    o resultado, olhe, media_depois.
  • 16:40 - 16:41
    Vou apertar o Enter.
  • 16:41 - 16:45
    Então essa é a média
    da performance do depois.
  • 16:45 - 16:48
    E agora nós também vamos
    achar o valor da mediana.
  • 16:48 - 16:49
    Visualizar, perdão.
  • 16:49 - 16:51
    Nós já temos o valor, né?
  • 16:51 - 16:56
    "print(mediana_depois)".
  • 16:56 - 16:57
    Eu vou apertar o Enter.
  • 16:57 - 17:01
    Então essa é a média,
    e essa é a mediana do depois.
  • 17:01 - 17:02
    Vou subir aqui.
  • 17:02 - 17:06
    Vamos pegar o nosso script, tá?
  • 17:06 - 17:11
    Já fizemos do antes, agora
    estamos calculando do depois.
  • 17:11 - 17:14
    Vamos achar agora o valor da moda.
  • 17:14 - 17:16
    É a mesma coisa que nós fizemos do antes,
  • 17:16 - 17:19
    só que agora é a moda para o depois.
  • 17:19 - 17:24
    Vamos apertar alguns Enters para ficar
    limpa a nossa área de programação
  • 17:24 - 17:25
    para podermos entender.
  • 17:25 - 17:28
    Criar a variável moda_depois,
  • 17:28 - 17:32
    "as numeric", que serve
    para converter os valores numéricos,
  • 17:32 - 17:34
    por mais que estejam ali.
  • 17:34 - 17:38
    Mas é bom confirmar
    que os valores são um número,
  • 17:38 - 17:40
    eles estão como número.
  • 17:40 - 17:44
    E aqui nós temos a parte da organização
    dos dados em ordem decrescente.
  • 17:44 - 17:50
    E aqui, qual é o conjunto de dados que vai
    ser feita essa moda, o valor da moda.
  • 17:50 - 17:53
    Se eu apertar o Enter...
    É igualzinho ao anterior.
  • 17:53 - 17:59
    Só muda que agora nós estamos fazendo
    a análise para os dados do depois
  • 17:59 - 18:02
    após implementação do algoritmo.
  • 18:02 - 18:08
    Então, a moda para o depois
    resultou em um valor de 190.
  • 18:08 - 18:13
    Vamos voltar mais um pouquinho aqui,
    pegar o script que nós deixamos.
  • 18:13 - 18:15
    A palavra não é pré-pronto. É pronto.
  • 18:15 - 18:17
    E vamos verificar.
  • 18:17 - 18:22
    Já geramos a moda, e agora nós vamos
    criar a variância e o desvio-padrão.
  • 18:22 - 18:25
    Vamos descobrir
    qual é o valor da variância
  • 18:25 - 18:28
    e qual é o valor do desvio-padrão
    para o depois.
  • 18:28 - 18:30
    Irei apertar novamente alguns Enters.
  • 18:31 - 18:33
    Vou dar um Control + V.
  • 18:33 - 18:34
    Deixe-me limpar aqui.
  • 18:34 - 18:37
    Se executarmos com esse tracinho
    aqui, vai ocorrer um erro.
  • 18:37 - 18:40
    O que nós temos aqui então?
  • 18:40 - 18:43
    Criamos uma variável
    chamada variancia_depois.
  • 18:43 - 18:47
    A instrução aqui é para calcular
    a variância dessa base de dados
  • 18:47 - 18:49
    utilizando o VAR, e o desvio-padrão.
  • 18:49 - 18:52
    Vou apertar um Enter.
  • 18:52 - 18:54
    Nós esperamos que dê certo, né?
  • 18:54 - 18:58
    E aqui vamos só visualizar
    para confirmar que deu certo.
  • 18:58 - 18:59
    Visualizou.
  • 18:59 - 19:05
    E agora nós vamos verificar o valor
    do desvio-padrão que foi encontrado.
  • 19:05 - 19:08
    "desvio_padrao_depois".
  • 19:08 - 19:10
    Opa, tem um errinho aqui, pessoal.
  • 19:10 - 19:11
    Cuidado aqui!
  • 19:11 - 19:12
    Eu visualizei o antes.
  • 19:12 - 19:15
    Não era o antes e sim o depois.
  • 19:15 - 19:15
    Vamos ver.
  • 19:15 - 19:18
    Oh, então aqui, print...
  • 19:19 - 19:23
    Não é um erro do script que nós
    criamos e sim na hora de visualizar.
  • 19:23 - 19:24
    O depois, tá?
  • 19:24 - 19:27
    Então essa é a variância do antes
    que tínhamos feito anteriormente.
  • 19:27 - 19:30
    E agora esse do depois,
    que acabamos de fazer, está vendo?
  • 19:30 - 19:36
    Tomem cuidado, senão vocês podem visualizar
    a informação que vocês não queriam.
  • 19:36 - 19:37
    Print...
  • 19:37 - 19:42
    Agora nós vamos verificar o valor
    do desvio-padrão do depois, hein!
  • 19:42 - 19:43
    Novamente, do depois.
  • 19:43 - 19:45
    O antes, nós já passamos.
  • 19:45 - 19:49
    Então esse é o valor
    da variância do depois,
  • 19:49 - 19:52
    e esse o valor do desvio-padrão do depois.
  • 19:52 - 19:58
    Agora vamos subir aqui e verificar
    o nosso script que deixamos pronto aqui.
  • 19:58 - 19:59
    Legal!
  • 19:59 - 20:02
    Nós já conseguimos criar...
  • 20:02 - 20:08
    Oh, vamos lembrar: a média, mediana,
    a moda, a variância, e o desvio-padrão,
  • 20:08 - 20:11
    para a base de dados do antes e do depois.
  • 20:11 - 20:16
    Agora nós podemos dizer
    que precisamos juntar tudo isso
  • 20:16 - 20:18
    para visualizar esses valores, tá?
  • 20:18 - 20:23
    Na verdade, aqui seria uma impressão
    de tudo que nós fizemos até agora.
  • 20:23 - 20:26
    Eu vou apertar alguns Enters aqui,
    mas é a última parte, tá?
  • 20:26 - 20:28
    São apenas duas instruções agora.
  • 20:28 - 20:30
    Opa! Vou apagar...
  • 20:30 - 20:31
    Control + V.
  • 20:31 - 20:33
    "O que é essa última parte, Rafa?"
  • 20:33 - 20:35
    "Imprimindo os resultados".
  • 20:35 - 20:40
    Vamos trabalhar aqui com todas
    as informações do antes e do depois.
  • 20:40 - 20:43
    Vou apertar o Enter...
  • 20:43 - 20:46
    É simples de visualizar, né?
  • 20:46 - 20:50
    A riqueza está no entender, né,
    entender todas essas informações.
  • 20:50 - 20:52
    Então o que nós temos aqui?
  • 20:52 - 20:53
    "Antes - Média".
  • 20:53 - 20:54
    Isso aqui é um texto, né?
  • 20:54 - 20:56
    Sempre que eu quero juntar
    um texto com valores,
  • 20:56 - 20:59
    eu coloco o "paste",
    aí eu coloco a informação,
  • 20:59 - 21:02
    divido por vírgula, e o nome da variável.
  • 21:02 - 21:07
    Na verdade, aqui é uma impressão mostrando
    tudo o que nós fizemos anteriormente.
  • 21:07 - 21:09
    Vamos pegar o outro script.
  • 21:09 - 21:11
    "Rafa, poderíamos fazer
    aqui na mão agora?"
  • 21:11 - 21:11
    Poderíamos.
  • 21:11 - 21:15
    Talvez demore só um pouquinho
    aqui para digitarmos juntos, né...
  • 21:16 - 21:18
    Para digitarmos essas informações.
  • 21:18 - 21:21
    Eu vou apertar mais alguns
    Enters aqui, como sempre.
  • 21:21 - 21:23
    Eu vou apertar um Enter.
  • 21:23 - 21:26
    O que nós temos aqui
    até o momento de uma revisão?
  • 21:26 - 21:30
    "Antes: media_antes", é esse valor,
  • 21:30 - 21:32
    media_antes é esse valor.
  • 21:32 - 21:36
    "Mediana: mediana_antes".
  • 21:36 - 21:38
    Então nós só juntamos aqui.
  • 21:38 - 21:41
    Seria uma impressão de tudo
    o que nós projetamos anteriormente.
  • 21:41 - 21:43
    E aqui é do depois.
  • 21:43 - 21:44
    E agora fica o quê?
  • 21:44 - 21:47
    Se pegarmos todo o nosso script,
  • 21:47 - 21:51
    pegamos desde uma introdução,
    o que é uma análise descritiva,
  • 21:51 - 21:56
    duas bases de dados,
    verificamos o antes e o depois,
  • 21:56 - 21:58
    calculamos a média, mediana,
  • 21:58 - 22:02
    conseguimos achar o valor da moda também,
  • 22:02 - 22:05
    tanto para os dados do antes
    como para do depois.
  • 22:05 - 22:06
    E enfim...
  • 22:06 - 22:10
    Só voltando, descendo um pouquinho aqui,
    agora conseguimos imprimir.
  • 22:10 - 22:16
    E com essas informações em mãos, nós
    conseguimos obter os nossos resultados.
  • 22:16 - 22:21
    Então aqui é o conjunto
    mostrando o resultado,
  • 22:21 - 22:23
    todas as informações numa impressão só.
  • 22:23 - 22:26
    Tudo que calculamos do antes,
    tudo que calculamos do depois.
  • 22:26 - 22:28
    E agora você consegue
    fazer a interpretação.
  • 22:28 - 22:31
    Vamos pegar o mais simples aqui:
  • 22:31 - 22:37
    a média de tempo de execução do antes,
    antes de implementar a melhoria no algoritmo,
  • 22:37 - 22:42
    supondo que fossem segundos, o tempo
    de execução demorava 218 segundos.
  • 22:42 - 22:44
    Agora caiu para 196.
  • 22:44 - 22:45
    E por aí vai.
  • 22:45 - 22:50
    Você consegue comparar o antes
    e o depois de cada uma dessas informações
  • 22:50 - 22:56
    para saber se realmente melhorou
    a performance do sistema
  • 22:56 - 22:59
    após a implementação
    da melhoria do algoritmo.
  • 22:59 - 23:02
    Eu tenho certeza que vocês
    conseguiram entender
  • 23:02 - 23:06
    a importância de saber utilizar todas
    essas instruções da Linguagem R,
  • 23:06 - 23:09
    e até mesmo saber
    interpretar esses resultados.
Title:
DSCR CAP03 2024 VA04 ESTUDO DE CASO ANALISE DESCRITIVA
Video Language:
Portuguese, Brazilian
Duration:
23:12

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions