< Return to Video

DSCR CAP03 2024 VA04 ESTUDO DE CASO ANALISE DESCRITIVA

  • 0:08 - 0:11
    Com certeza na sua vida
    pessoal ou profissional
  • 0:11 - 0:16
    você já se deparou com uma situação
    que você tem que verificar a performance
  • 0:16 - 0:21
    do antes e o depois de algo, como
    por exemplo, no computador da sua casa.
  • 0:21 - 0:24
    Supondo que você vai
    aumentar a memória RAM,
  • 0:24 - 0:29
    e ele está demorando cinco minutos
    para iniciar, e aí você coloca memória RAM,
  • 0:29 - 0:33
    depois você quer verificar o quanto
    melhorou, ou se melhorou,
  • 0:33 - 0:36
    então você está fazendo
    uma análise do antes e o depois.
  • 0:36 - 0:40
    E a nossa linguagem R também nos ajuda
    a fazer a análise do antes e o depois.
  • 0:40 - 0:46
    Só que, nesse caso, nós precisamos ter dados
    que consigam fazer essa comparação.
  • 0:46 - 0:48
    Vamos trazer aqui
    um exemplo para vocês.
  • 0:48 - 0:52
    Nesse exemplo, pense num caso
    real da fábrica de software.
  • 0:52 - 0:56
    Nós temos lá um sistema funcionando
    que vai para a produção
  • 0:56 - 0:59
    e aí descobrimos que a performance
    dele não está muito boa.
  • 0:59 - 1:03
    Fizeram uma medição hora
    a hora nessa nossa performance.
  • 1:03 - 1:08
    Então, após essa análise
    de uma performance não tão boa,
  • 1:08 - 1:12
    melhorar o algoritmo, que é
    a lógica que está dentro do sistema,
  • 1:12 - 1:15
    e, após, fazer uma nova medição.
  • 1:15 - 1:16
    É isso que vamos ver agora,
  • 1:16 - 1:19
    vamos fazer uma análise
    descritiva do antes e depois
  • 1:19 - 1:23
    para vocês terem a confiança
    dos dados que estão sendo analisados,
  • 1:23 - 1:24
    e até mesmo o seu resultado.
  • 1:24 - 1:26
    Vem comigo que eu vou mostrar para vocês.
  • 1:26 - 1:32
    Como sempre, eu deixo um script pronto,
    não somente as linhas de execução,
  • 1:32 - 1:36
    o código do que precisamos fazer,
    mas também um comentário.
  • 1:36 - 1:40
    Um breve resumo da análise
    descritiva está aqui no começo.
  • 1:40 - 1:45
    Depois, se você quiser
    fazer uma pausa, ler e interpretar
  • 1:45 - 1:49
    sobre o que é uma análise descritiva,
    aqui fica um breve resumo.
  • 1:49 - 1:53
    Então, como nós falamos, nós
    precisamos de uma base de dados
  • 1:53 - 1:54
    para poder analisar isso.
  • 1:54 - 1:58
    Vamos rodar essas duas linhas aqui,
    criar os nossos dados
  • 1:58 - 2:01
    para ter esse comparativo
    do antes e o depois.
  • 2:02 - 2:04
    Se pegar aqui...
  • 2:04 - 2:05
    Perdão. Vamos dar uns Enters aqui.
  • 2:05 - 2:09
    Sempre apertamos alguns Enters
    para ficar uma área limpa aqui.
  • 2:09 - 2:13
    Então nós estamos criando aqui
    um comentário, uma hashtag.
  • 2:13 - 2:18
    O tempo antes da performance:
    hora um, hora dois, hora três.
  • 2:18 - 2:22
    Aqui nós temos quatro,
    cinco, seis, sete, oito.
  • 2:22 - 2:24
    É uma análise do antes e o depois
  • 2:24 - 2:28
    em oito horas de execução
    de um código, por exemplo.
  • 2:28 - 2:31
    Antes de implementar a melhoria no algoritmo,
  • 2:31 - 2:34
    e depois de implementar
    a melhoria no algoritmo.
  • 2:34 - 2:36
    Vamos apertar o Enter.
  • 2:36 - 2:40
    E aí, como sempre, é legal visualizar
    como estão os dados.
  • 2:40 - 2:43
    Olhe, tempo antes... Aperte o Enter.
  • 2:43 - 2:45
    Opa, o que eu errei aqui?
  • 2:45 - 2:46
    Print...
  • 2:46 - 2:48
    Ah, "tempos", está vendo?
  • 2:48 - 2:50
    O que eu errei?
  • 2:50 - 2:51
    "tempo antes"...
  • 2:51 - 2:53
    Agora vai funcionar.
  • 2:53 - 2:54
    Aqui tem a letra "s".
  • 2:54 - 2:56
    São tempos, né?
  • 2:56 - 2:59
    Eu não tinha colocado o "s",
    então ele falou: "Opa!, Not found".
  • 2:59 - 3:01
    Not found quer dizer que não existe.
  • 3:01 - 3:03
    Ai depois eu coloquei certo.
  • 3:03 - 3:06
    Então sigam aquela velha dica, né,
    ou vocês colocam aqui print,
  • 3:06 - 3:12
    vocês copiam o nome da variável
    e colocam aqui no conjunto de dados,
  • 3:12 - 3:17
    ou você digita, e ele dá
    a sugestão do nome.
  • 3:17 - 3:18
    Aqui, no caso, ele deu a sugestão.
  • 3:18 - 3:21
    A sugestão está correta, eu vou apertar.
  • 3:21 - 3:25
    Então temos a análise do antes e o depois.
  • 3:25 - 3:29
    Facilitando a interpretação
    aqui, se formos verificar,
  • 3:29 - 3:33
    como sempre temos um conjunto
    de valores bem pequeno
  • 3:33 - 3:35
    para facilitar a nossa análise.
  • 3:36 - 3:41
    Olhando, nós já podemos fazer
    esse resultado prévio sem o R.
  • 3:41 - 3:44
    O antes e o depois, o depois ficou melhor.
  • 3:44 - 3:47
    Então implementou-se a melhoria no algoritmo
  • 3:47 - 3:51
    e houve realmente uma melhor
    performance no sistema.
  • 3:51 - 3:56
    Inclusive, olhando em todas as horas
    de execução, realmente está melhor.
  • 3:56 - 3:58
    Eu, olhando, consigo.
  • 3:58 - 4:02
    Mas se fosse uma análise
    com 300 horas de execução,
  • 4:02 - 4:06
    iria ficar bem difícil vocês
    conseguirem olhando.
  • 4:06 - 4:09
    Então vamos pedir para o R fazer para nós.
  • 4:09 - 4:10
    O que vamos fazer?
  • 4:10 - 4:12
    Vamos para a próxima parte.
  • 4:12 - 4:15
    Então criamos o antes e o depois,
  • 4:15 - 4:17
    Vamos apertar mais alguns Enters aqui.
  • 4:17 - 4:20
    É sempre legal para facilitar a nossa área.
  • 4:20 - 4:23
    Vamos para uma próxima parte.
  • 4:23 - 4:26
    Nós vamos agora gerar todo o cenário
  • 4:26 - 4:31
    para calcular as medidas
    descritivas para o antes.
  • 4:31 - 4:35
    Então nós vamos fazer primeiro uma análise
    do antes, preparar esses dados do antes.
  • 4:35 - 4:40
    Aqui nós vamos calcular
    a média simples do antes,
  • 4:40 - 4:44
    e vamos calcular a mediana do antes.
  • 4:44 - 4:45
    Vamos aqui?
  • 4:45 - 4:49
    Eu vou apertar o Enter, vou apertar print.
  • 4:49 - 4:51
    Olhe, média...
  • 4:51 - 4:55
    Aí aqui, aquela velha história,
    ou você copia "media_antes",
  • 4:55 - 4:58
    ou você deixa ele fazer
    a sugestão para você.
  • 4:58 - 5:00
    Então essa é a média.
  • 5:00 - 5:05
    Se somar todos esses valores,
    são quatro, cinco, seis, oito valores.
  • 5:05 - 5:06
    São oito horas de análise.
  • 5:06 - 5:10
    Somo e divido por oito, vai ser a média.
  • 5:10 - 5:14
    Além de calcular a média
    que acabamos de visualizar,
  • 5:14 - 5:17
    nós também pedimos
    para calcular a mediana.
  • 5:17 - 5:19
    Vamos visualizar o valor da mediana?
  • 5:20 - 5:24
    "Ô, Rafa, estamos tendo que utilizar
    os conceitos que aprendemos anteriormente."
  • 5:24 - 5:25
    Sim. Isso é bom, né?
  • 5:25 - 5:28
    As coisas vão se juntando.
  • 5:28 - 5:29
    E aqui a mediana.
  • 5:29 - 5:31
    Opa, um sinalzinho a mais.
  • 5:31 - 5:34
    Então esse é o valor da média
    e esse é o valor da mediana.
  • 5:34 - 5:39
    São informações referentes
    aos dados do antes, tudo bem?
  • 5:39 - 5:43
    Então está aqui o nosso script,
    o resumo para vocês.
  • 5:43 - 5:48
    Já criamos os dados do antes e o depois,
  • 5:48 - 5:53
    já fizemos aqui o cálculo da média e da mediana.
  • 5:53 - 5:55
    Também já fizemos.
  • 5:55 - 5:57
    E agora nós vamos para uma próxima parte.
  • 5:57 - 6:02
    Eu estou copiando essa parte do código,
    isolando-o, e vamos trazer aqui para baixo.
  • 6:02 - 6:05
    Como sempre é legal
    apertar um pouquinho de Enter aqui
  • 6:05 - 6:08
    para isolar a área do código
    para podermos interpretar.
  • 6:10 - 6:13
    Deixe-me limpar um pouquinho aqui
    para facilitar a visualização.
  • 6:13 - 6:17
    Opa,.. Damos um Control + Z aqui.
  • 6:17 - 6:19
    Antes de apertar o Enter,
    você dá um Control + Z.
  • 6:21 - 6:23
    "E agora, Rafa, o que nós temos?"
  • 6:23 - 6:28
    Nós temos três linhas de comentário
    aqui para deixar para vocês, tá?
  • 6:28 - 6:31
    Lembrando que às vezes esse é o momento
    que você pode dar uma pausa no vídeo,
  • 6:31 - 6:34
    antes de eu falar ou após eu falar.
  • 6:34 - 6:39
    Por quê? Porque você precisa entender esses
    comentários que não fazem parte da execução.
  • 6:39 - 6:44
    E depois que você conseguir entender
    essas três linhas de comentários,
  • 6:44 - 6:47
    nós poderemos fazer a execução
    do que precisamos.
  • 6:47 - 6:48
    Vamos entender?
  • 6:48 - 6:50
    O que eu criei para vocês então?
  • 6:50 - 6:52
    O "moda_antes".
  • 6:52 - 6:54
    É o nome de uma variável.
  • 6:54 - 6:55
    Aí é sinal de menor, tracinho.
  • 6:55 - 6:57
    "Ô, Rafa, já entendi.
  • 6:57 - 7:01
    O resultado daqui será
    armazenado no moda_antes."
  • 7:01 - 7:03
    "Mas o que nós estamos fazendo, Rafa?"
  • 7:03 - 7:04
    Vamos aqui.
  • 7:04 - 7:08
    Primeiro vem uma instrução
    aqui do R, "as.numeric".
  • 7:08 - 7:10
    O que é isso?
  • 7:10 - 7:15
    Vocês vão usar muito ainda dentro
    da linguagem R na parte estatística.
  • 7:15 - 7:19
    É utilizado para converter
    os valores em vetor numérico.
  • 7:19 - 7:23
    Aí pode vir uma pergunta na sua cabeça:
  • 7:23 - 7:24
    "Mas, Rafa, como assim?
  • 7:24 - 7:26
    Os dados são numéricos."
  • 7:26 - 7:31
    Você sabe porque o conjunto de dados,
    essas oito horas, é pequeno.
  • 7:31 - 7:33
    Mas quem garante isso?
  • 7:33 - 7:36
    É sempre bom você confirmar, tá?
  • 7:36 - 7:39
    Então, voltando aqui, olhando,
    nós sabemos que eles são numéricos,
  • 7:39 - 7:43
    mas você tem que garantir isso
    para poder fazer essa análise.
  • 7:43 - 7:46
    É isso que o as.numeric faz.
  • 7:46 - 7:50
    Se não for, tiver algum probleminha lá
    e o dado for possível de conversão para numérico,
  • 7:50 - 7:52
    ele vai ser feito, é o as.numeric.
  • 7:54 - 7:58
    E aí nós vamos continuar aqui
    a interpretar essa parte dessa instrução.
  • 7:59 - 8:00
    Aqui são os nomes.
  • 8:00 - 8:01
    O que são os nomes?
  • 8:01 - 8:03
    É o conjunto de valores.
  • 8:03 - 8:05
    Nós temos apenas um conjunto de valores.
  • 8:05 - 8:06
    Poderíamos ter mais?
  • 8:06 - 8:07
    Sim.
  • 8:07 - 8:09
    Se fosse um dataframe
    com diversas colunas? Poderia.
  • 8:09 - 8:13
    Aqui nós temos uma linha, ou uma coluna.
  • 8:13 - 8:15
    É um exemplo um pouco mais simples.
  • 8:15 - 8:17
    E aí você entra aqui no "sort".
  • 8:17 - 8:18
    O que seria o sort?
  • 8:18 - 8:22
    Novamente, fica aqui
    um comentário para vocês.
  • 8:22 - 8:26
    Vocês já tenham utilizado em alguma
    outra linguagem de programação.
  • 8:26 - 8:28
    Quem não usou, não
    tem problema nenhum, tá?
  • 8:28 - 8:30
    Esse é o momento de aprender.
  • 8:30 - 8:34
    Ele é utilizado para ordenar os elementos.
  • 8:34 - 8:39
    Porque se vocês pegarem aqui,
    esse o primeiro aqui do antes,
  • 8:39 - 8:42
    não é obrigatório que ele esteja
    numa ordem crescente ou decrescente.
  • 8:42 - 8:43
    "Porque não, Rafa?"
  • 8:43 - 8:44
    É uma análise.
  • 8:44 - 8:50
    Supondo que, na primeira hora, demorou 220
    segundos para executar na segunda, 210.
  • 8:50 - 8:54
    Então vai ser difícil você encontrar
    na ordem crescente ou decrescente.
  • 8:54 - 8:58
    Você está olhando hora a hora
    como ele se comporta.
  • 8:58 - 9:00
    O que você vai fazer então?
  • 9:00 - 9:03
    Por isso que vem essa instrução sort.
  • 9:03 - 9:07
    Você vai dizer que, nessa instrução true ou false,
  • 9:07 - 9:12
    se você colocar true, você está
    pedindo para que essa análise
  • 9:12 - 9:16
    seja feita numa ordem decrescente.
  • 9:16 - 9:21
    Se você colocar false, ele vai
    fazer uma ordem crescente.
  • 9:21 - 9:23
    Lembrando que decrescente,
    do maior para o menor,
  • 9:23 - 9:25
    que vai ser como ele
    vai analisar esse caso.
  • 9:25 - 9:30
    E se fosse crescente,
    do menor para o maior.
  • 9:30 - 9:33
    Esse é o sort.
  • 9:33 - 9:36
    Bem recheada de conhecimento
    essa instrução aqui.
  • 9:36 - 9:39
    E o que é o "table"?
  • 9:39 - 9:42
    É o conjunto de dados para ser analisado.
  • 9:42 - 9:46
    Lembrando, aqui é uma linha
    só, que é o tempo antes,
  • 9:46 - 9:48
    mas poderia ser um dataframe.
  • 9:48 - 9:52
    Então esse é o conjunto de dados
    que nós estamos pedindo para analisar.
  • 9:53 - 9:54
    Vamos apertar um Enter.
  • 9:55 - 9:56
    E aí, o que nós temos?
  • 9:56 - 9:58
    "Rafa, e agora?"
  • 9:58 - 9:59
    Quer olhar o resultado?
  • 9:59 - 10:00
    Vamos olhar, lógico.
  • 10:00 - 10:01
    "print"...
  • 10:01 - 10:06
    Ou você copia e cola, ou você
    digita e deixa ele dar a sugestão.
  • 10:06 - 10:08
    Realmente é esse que eu quero.
  • 10:08 - 10:13
    Se eu apertar o Enter,
    o que ele nos trouxe de resultado?
  • 10:13 - 10:17
    Essa análise chegou num resultado de 210.
  • 10:17 - 10:20
    Mas o que seria esse número 210?
  • 10:20 - 10:23
    Vamos continuar aqui, aí
    eu vou explicar para vocês.
  • 10:23 - 10:26
    Aqui foi a introdução, os dois dados,
  • 10:26 - 10:30
    calculamos a média e a mediana do antes.
  • 10:30 - 10:33
    E aqui, nós conseguimos fazer a moda,
  • 10:33 - 10:38
    qual o número moda que é gerado com essa
    análise desses dados, desse conjunto.
  • 10:38 - 10:42
    De novo, continuamos
    com o intervalo de valores do antes.
  • 10:42 - 10:44
    Ainda não fizemos o depois.
  • 10:44 - 10:46
    Vamos continuar?
  • 10:46 - 10:51
    Aqui nós vamos para uma outra parte
    do nosso código da nossa análise.
  • 10:51 - 10:55
    Eu vou copiar a descer um pouquinho.
  • 10:56 - 10:59
    Novamente, aquela velha dica: se possível...
  • 10:59 - 11:02
    É que aqui eu que estou transmitindo
    conhecimento para vocês;
  • 11:02 - 11:04
    Se você quiser, não
    precisa apertar o Enter.
  • 11:04 - 11:08
    Mas é legal para vocês dividirem
    por partes essa análise, tá?
  • 11:08 - 11:10
    Aqui, novamente, tem uma hashtag.
  • 11:10 - 11:15
    Deixe-me só limpar o código aqui para quando
    executá-lo depois não acontecer nenhum erro.
  • 11:17 - 11:18
    Aqui eu deixo esse comentário, né?
  • 11:18 - 11:21
    Nós iremos verificar a variância.
  • 11:21 - 11:23
    O que é a variância?
  • 11:23 - 11:28
    É uma medida estatística que indica
    a dispersão dos valores em relação à média.
  • 11:28 - 11:30
    Nós não temos a média?
  • 11:30 - 11:32
    O quanto os valores...
  • 11:32 - 11:33
    "Que valores, Rafa?"
  • 11:33 - 11:39
    O quanto cada um desses valores
    está distantes da média.
  • 11:39 - 11:40
    Por isso que nós fizemos aqui, olhe.
  • 11:40 - 11:42
    Essa não é a média?
  • 11:42 - 11:43
    Deu 218.
  • 11:43 - 11:47
    Se eu olhar aqui, me parece...
  • 11:47 - 11:50
    Olhando aqui, interpretando, qual
    parece que está mais distante?
  • 11:50 - 11:52
    Mas não vamos deixar
    o computador fazer por nós, né?
  • 11:52 - 11:53
    Talvez seja esse.
  • 11:53 - 11:56
    Qual está mais perto de 218.
  • 11:56 - 11:59
    Olhando aqui, o valor 220, tá?
  • 12:00 - 12:02
    Mas deixe que o computador nos fale.
  • 12:02 - 12:08
    Nesse intervalo de valores, quais estão
    mais perto ou menos perto da média?
  • 12:08 - 12:14
    Quanto maior a variância,
    mais dispersos os dados estão.
  • 12:14 - 12:20
    Ou seja, o valor do resultado da variância
    que nós vamos pedir para calcular agora,
  • 12:20 - 12:25
    quanto maior o número,
    mais distante estará da média.
  • 12:25 - 12:30
    Então tem uma disparidade aí,
    uma distância da média dos dados.
  • 12:30 - 12:32
    Aí vamos executar.
  • 12:32 - 12:36
    Como sempre, para executar,
    eu vou apertar um Enter aqui,
  • 12:36 - 12:39
    e aí nós vamos analisar,
    olhe: variância antes,
  • 12:39 - 12:42
    nós queremos encontrar
    como eu acho o valor da variância,
  • 12:42 - 12:45
    que é isso que acabamos de explicar aqui.
  • 12:45 - 12:50
    E, novamente, é melhor
    você fazer uma pausa, anotar,
  • 12:50 - 12:53
    verificar o material escrito
    que está disponível para vocês
  • 12:53 - 12:56
    para depois você conseguir executar aqui.
  • 12:56 - 13:01
    Então, aqui, como eu consigo
    armazenar o valor da variância
  • 13:01 - 13:05
    do conjunto de dados tempos_antes?
  • 13:06 - 13:10
    Como eu consigo pedir
    para ele achar a variância aqui?
  • 13:10 - 13:11
    É simples.
  • 13:11 - 13:14
    Depois que você entendeu
    o conceito, é simples.
  • 13:14 - 13:19
    Você cria uma variável, que, nesse caso,
    eu chamei de "variancia_antes".
  • 13:19 - 13:23
    Aqui eu coloco a instrução, que é "var", v-a-r,
  • 13:23 - 13:25
    e o nome do conjunto de dados.
  • 13:25 - 13:27
    "Ah, Rafa, eu quero dar uma olhadinha".
  • 13:27 - 13:29
    Quer dar uma olhadinha?
  • 13:29 - 13:31
    Podemos, não tem problema não.
  • 13:31 - 13:34
    Olhe, "variancia_antes", não é isso?
  • 13:34 - 13:41
    Se apertarmos o Enter, conseguiremos saber
    qual que é o valor, o resultado da variância.
  • 13:41 - 13:44
    Agora o desvio-padrão.
  • 13:44 - 13:47
    O desvio-padrão, vocês já
    têm esse conhecimento.
  • 13:47 - 13:49
    Como calcular o desvio padrão?
  • 13:49 - 13:50
    Vamos criar uma variável.
  • 13:50 - 13:54
    Desvio-padrão antes porque
    nós estamos analisando
  • 13:54 - 13:57
    antes da implementação
    da melhoria do algoritmo,
  • 13:57 - 14:00
    "sd" é a instrução, e qual
    é o conjunto de dados.
  • 14:00 - 14:03
    "Rafa, podemos visualizar?"
  • 14:03 - 14:04
    Lógico que podemos.
  • 14:04 - 14:06
    Qual é o nome da variável?
  • 14:06 - 14:08
    "desvio_padrao_antes".
  • 14:09 - 14:11
    Legal.
  • 14:11 - 14:17
    E aqui nós temos que o desvio padrão
    para esse conjunto de valores é 7.03.
  • 14:17 - 14:24
    Agora que conseguimos encontrar o valor
    da variância e também do desvio-padrão,
  • 14:24 - 14:29
    vamos continuar para conseguir concluir
    a análise que queremos do antes e o depois.
  • 14:29 - 14:30
    Então, o que nós já vimos?
  • 14:30 - 14:33
    Retomamos essa parte, criamos os dados,
  • 14:33 - 14:38
    criamos a média e a mediana do antes,
  • 14:38 - 14:41
    conseguimos achar a moda,
  • 14:41 - 14:46
    acabamos de descobrir
    a variância e o desvio-padrão.
  • 14:46 - 14:48
    Agora vamos para essa
    próxima parte da análise.
  • 14:48 - 14:51
    Vou copiar aqui para baixo.
  • 14:51 - 14:55
    Aqui, como sempre, eu
    vou apertar alguns Enters
  • 14:55 - 14:58
    para facilitar para vocês a visualização.
  • 14:58 - 15:00
    Vou apertaram um Control + V.
  • 15:00 - 15:03
    Deixe-me arrumar aqui para explicar.
  • 15:03 - 15:05
    O que nós vamos fazer agora então?
  • 15:05 - 15:09
    Olhe, calculando medidas
    descritivas para o depois agora, né?
  • 15:09 - 15:12
    Fizemos o antes, vamos para o depois.
  • 15:12 - 15:16
    Agora nós iremos repetir o script
    que nós fizemos anteriormente
  • 15:16 - 15:19
    para a parte da execução do antes.
  • 15:19 - 15:21
    Agora nós iremos fazer para o depois.
  • 15:21 - 15:24
    Lembre-se do cenário, do case.
  • 15:24 - 15:29
    Tem um sistema que não estava
    com uma performance tão boa de algoritmo.
  • 15:29 - 15:33
    Então fizeram uma análise,
    extraíram os tempos de execução
  • 15:33 - 15:36
    antes da implementação
    da melhoria no algoritmo,
  • 15:36 - 15:40
    e aí precisava-se fazer uma análise do depois.
  • 15:40 - 15:42
    Então, no depois, nós temos a base de dados,
  • 15:42 - 15:44
    como está a performance do depois,
  • 15:44 - 15:48
    e agora o R vai verificar
    o antes e o depois
  • 15:48 - 15:53
    para fazer esse comparativo
    e conseguir ter uma análise descritiva.
  • 15:53 - 15:56
    Fizemos para o antes, vamos
    fazer a mesma coisa agora
  • 15:56 - 15:59
    para o conjunto de dados do depois.
    Vem aqui comigo.
  • 15:59 - 16:05
    Então, como sempre, eu deixo
    um comentário para vocês,
  • 16:05 - 16:08
    calculando medidas descritivas para depois
  • 16:08 - 16:12
    nós iremos achar a média,
    a média de quem alpha.
  • 16:12 - 16:14
    Lembre se. Agora
  • 16:14 - 16:19
    vamos trabalhar com essa base de dados,
    a performance do algoritmo do depois.
  • 16:19 - 16:21
    Então vamos descer um pouquinho.
  • 16:21 - 16:26
    Nós estamos aqui cria uma variável
    chamado média depois esse é o nome.
  • 16:26 - 16:29
    Esse é o nome da base de dados
    e vamos também achar os valores.
  • 16:29 - 16:32
    O valor da mediana.
  • 16:32 - 16:36
    Se eu apertar um entra aqui é sempre legal
    visualizar o resultado,
  • 16:36 - 16:40
    a média depois e o depois.
  • 16:40 - 16:41
    Vou apertar o enter.
  • 16:41 - 16:44
    Então essa é a média
    da performance do depois.
  • 16:45 - 16:48
    E agora nós vamos achar também
    o valor da mediana Visualizar.
  • 16:48 - 16:52
    Perdão, nós já temos o valor 20
  • 16:52 - 16:54
    mediano, não underline.
  • 16:54 - 16:57
    Depois vou apertar o então.
  • 16:57 - 17:02
    Então essa é a média e essa é a mediana do
    depois vou subir aqui,
  • 17:02 - 17:06
    vamos pegar o nosso script, tá?
  • 17:06 - 17:08
    Já fizemos antes, agora
  • 17:08 - 17:14
    nós estamos calculando tudo,
    depois vamos achar agora o valor da moda
  • 17:14 - 17:15
    é a mesma coisa
  • 17:15 - 17:19
    que nós fizemos do antes,
    só que agora é a moda para depois.
  • 17:19 - 17:22
    Vamos apertar alguns enter
    para ficar limpa a hora
  • 17:22 - 17:26
    que nossa de programação
    poder entender criar a variável modo
  • 17:27 - 17:32
    e logo depois depois as numeric len serve
    serve para converter os valores
  • 17:32 - 17:37
    numérico, por mais que estão ali, mas
    é bom confirmar que os valores existam.
  • 17:37 - 17:40
    São um número, eles estão como número.
  • 17:40 - 17:44
    E aqui nós temos a parte da organização
    dos dados em ordem decrescente.
  • 17:44 - 17:49
    E aqui, qual que é o conjunto de dados aí
    que vai ser feita essa moda?
  • 17:49 - 17:53
    O valor da moda, se eu apertar o enter
    é igualzinho anterior,
  • 17:53 - 17:57
    só muda que
    agora nós estamos fazendo a análise
  • 17:57 - 18:02
    para os dados do depois,
    porque após implementação do algoritmo,
  • 18:02 - 18:08
    então a moda para o depois de um valor
    resultou em um valor de 190.
  • 18:08 - 18:13
    Vamos voltar mais um pouquinho aqui
    de pegar o script que nós deixamos
  • 18:13 - 18:15
    a palavra pré pronto e pronto
  • 18:15 - 18:18
    e vamos verificar o já geramos a moda
  • 18:18 - 18:22
    e agora nós vamos criar,
    que é a variância, é o desvio padrão.
  • 18:22 - 18:25
    Vamos descobrir
    qual é o valor da variância
  • 18:25 - 18:29
    e qual o valor do desvio padrão para o
    depois e de apertar novamente alguns.
  • 18:29 - 18:31
    Então
  • 18:31 - 18:34
    vou dar um control v se eu só limpar aqui,
  • 18:34 - 18:37
    se a gente executar com esse tracinho
    aqui vai vai ocorrer um erro.
  • 18:37 - 18:40
    Então o que nós temos aqui?
  • 18:40 - 18:42
    Criamos uma variável chamada variância.
  • 18:42 - 18:47
    Depois aqui a instrução para calcular
    a variância dessa base de dados
  • 18:47 - 18:49
    utilizando o VAR e o desvio padrão.
  • 18:49 - 18:52
    Vou apertar enter.
  • 18:52 - 18:54
    A gente esperava que dá certo.
  • 18:54 - 18:58
    E aqui vamos só visualizar
    para confirmar que deu certo.
  • 18:58 - 18:59
    Visualizou?
  • 18:59 - 19:04
    E agora vamos verificar
    o valor do desvio padrão que foi
  • 19:04 - 19:05
    encontrado.
  • 19:05 - 19:09
    Desvio padrão
    depois ou pode ter um errinho aqui?
  • 19:09 - 19:15
    Pessoal, cuidado aqui eu visualizei
    o antes, não era o antes e sim o depois.
  • 19:15 - 19:15
    Vamos ver.
  • 19:15 - 19:19
    Oh, então aqui o print é um erro.
  • 19:19 - 19:21
    Não é um erro do script que a gente criou.
  • 19:21 - 19:24
    Tais sim, na hora de visualizar o depois.
  • 19:24 - 19:27
    Oh, então essa é a variância
    do que tínhamos feito anteriormente.
  • 19:27 - 19:30
    E agora esse erro
    depois que acabamos de fazer.
  • 19:30 - 19:30
    Tá vendo?
  • 19:30 - 19:31
    Tomem cuidado,
  • 19:31 - 19:36
    senão vocês podem estar a visualizar
    a informação que você não queria.
  • 19:36 - 19:37
    Print.
  • 19:37 - 19:42
    Agora vamos verificar o que o valor
    do desvio padrão do depois.
  • 19:42 - 19:45
    Sim, novamente
    depois ou antes nós já passamos.
  • 19:45 - 19:46
    Esse é o valor.
  • 19:46 - 19:49
    Então nova aliança do depois.
  • 19:49 - 19:51
    É esse o valor do desvio padrão.
  • 19:51 - 19:52
    Depois.
  • 19:52 - 19:56
    Agora vamos subir aqui
    e verificar o nosso script
  • 19:56 - 19:59
    que nós deixamos pronto aqui. Legal!
  • 19:59 - 20:02
    Nós já conseguimos criar,
  • 20:02 - 20:06
    vamos lembrar a média mediana, a moda,
  • 20:06 - 20:11
    a variância e o desvio padrão
    para base de dados do antes e do depois.
  • 20:11 - 20:15
    Agora podemos dizer que a gente precisa
    juntar tudo isso
  • 20:16 - 20:19
    para visualizar esses valores aqui.
  • 20:19 - 20:22
    Na verdade, seria uma impressão
    de tudo que nós fizemos até agora.
  • 20:22 - 20:26
    Só vou apertar alguns em três aqui,
    mas a última parte
  • 20:26 - 20:28
    são apenas duas instruções agora.
  • 20:28 - 20:30
    Opa, vou apagar.
  • 20:30 - 20:33
    Controlo
    ver o que essa última parte, Rafa,
  • 20:33 - 20:37
    imprimindo os resultados aqui
    vamos trabalhar
  • 20:37 - 20:41
    com todas as informações do antes
    e o depois.
  • 20:41 - 20:41
    Vou apertar.
  • 20:41 - 20:46
    Então é assim simples de visualizar
  • 20:46 - 20:50
    o entender que está na riqueza,
    entender todas essas informações.
  • 20:50 - 20:51
    Então o que nós temos aqui?
  • 20:51 - 20:55
    Olha aqui,
    antes disso, aqui é um texto sempre.
  • 20:55 - 20:58
    Eu quero juntar um texto com valores,
    eu coloco teste, aí
  • 20:58 - 20:59
    eu coloco a informação, lembra?
  • 20:59 - 21:01
    Divido por vírgula.
  • 21:01 - 21:04
    E o nome da variável só aqui,
    na verdade é uma impressão
  • 21:04 - 21:07
    mostrando tudo o que nós fizemos
    anteriormente.
  • 21:07 - 21:09
    Vamos pegar o outro script.
  • 21:09 - 21:12
    Poderíamos fazer aqui na mão
    agora, poderíamos talvez
  • 21:12 - 21:16
    demorar só um pouquinho
    aqui para vocês, pra gente digitar junto
  • 21:16 - 21:18
    para digitarmos essas informações.
  • 21:18 - 21:20
    Nós apertar mais alguns inteiros.
  • 21:20 - 21:24
    Aqui, como sempre, vou apertar muito
    o que nós temos aqui
  • 21:24 - 21:27
    até um momento de uma revisão antes,
  • 21:27 - 21:31
    a média antes e esse valor média antes
  • 21:31 - 21:34
    e esse valor mediano
  • 21:34 - 21:36
    antes mediana antes.
  • 21:36 - 21:39
    Então, aqui nós só juntamos uma impressão
    de tudo o que nós
  • 21:39 - 21:43
    projetamos anteriormente e aqui do depois.
  • 21:43 - 21:47
    E é agora que fica o que se a gente pegar
    o nosso TO do nosso script,
  • 21:47 - 21:49
    pegamos desde uma introdução.
  • 21:49 - 21:51
    O que é uma análise descritiva,
  • 21:51 - 21:56
    duas bases de dados
    com verificamos o antes e o depois,
  • 21:56 - 22:01
    calculamos a média mediana,
    conseguimos nos achar o valor da moda
  • 22:01 - 22:05
    também, tanto para os dados do antes
    como depois
  • 22:05 - 22:08
    e enfim, só voltando,
    descendo um pouquinho aqui,
  • 22:08 - 22:12
    agora a gente consegue imprimir
    e com essas informações
  • 22:12 - 22:16
    em mãos nós conseguimos obter os nossos
    resultados.
  • 22:16 - 22:19
    Então aqui é o conjunto
  • 22:20 - 22:21
    mostrando o resultado.
  • 22:21 - 22:22
    Todas as informações numa impressão
  • 22:22 - 22:26
    só, tudo o que calculamos antes,
    tudo que calculamos o depois.
  • 22:26 - 22:28
    E agora que você consegue fazer
    a interpretação,
  • 22:28 - 22:33
    vamos pegar o mais simples
    aqui a média de tempo de execução
  • 22:34 - 22:37
    do antes antes de implementar
    a melhoria no algoritmo.
  • 22:37 - 22:38
    O tempo de execução.
  • 22:38 - 22:42
    Supondo que fossem segundos,
    demorava 218/2.
  • 22:42 - 22:45
    Agora caiu para 196 e por aí vai.
  • 22:45 - 22:50
    Você consegue comparar o antes
    e o depois de cada uma dessas informações
  • 22:50 - 22:53
    para saber se realmente
  • 22:53 - 22:56
    melhorou a performance do sistema
  • 22:56 - 23:00
    após a implementação
    da melhoria do algoritmo?
  • 23:00 - 23:01
    Eu tenho certeza que vocês conseguiram
  • 23:01 - 23:05
    entender a importância de saber
    utilizar todas essas instruções,
  • 23:05 - 23:09
    a linguagem R e até mesmo saber
    interpretar esses resultados e.
Title:
DSCR CAP03 2024 VA04 ESTUDO DE CASO ANALISE DESCRITIVA
Video Language:
Portuguese, Brazilian
Duration:
23:12

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions