< Return to Video

DSCR CAP03 2024 VA02 LINGUAGEM R INTERVALOS DE CONFIANCA

  • 0:08 - 0:13
    Agora nós iremos falar sobre intervalo
    de confiança e teste de hipóteses.
  • 0:13 - 0:16
    Para entender isso na prática
    com a linguagem R,
  • 0:16 - 0:19
    se vocês verificarem no documento
    que está disponível para vocês
  • 0:19 - 0:22
    sobre essa explicação,
    trouxemos um case real.
  • 0:22 - 0:25
    Imagine que nós estamos trabalhando
    em uma fábrica de software
  • 0:25 - 0:30
    e você se depara com a situação
    de precisar melhorar a performance
  • 0:30 - 0:32
    dessa equipe de programadores.
  • 0:32 - 0:36
    Então, foi analisada essa possibilidade
    de implementar uma melhoria,
  • 0:36 - 0:41
    foi descoberta uma ferramenta
    para ajudar, e aí precisamos medir
  • 0:41 - 0:45
    como estava a performance antes
    da implementação dessa ferramenta
  • 0:45 - 0:48
    e após a implementação dessa ferramenta.
  • 0:48 - 0:54
    Para verificar se após a implementação
    da ferramenta ficou igual a performance,
  • 0:54 - 0:59
    se ficou pior, ou se alcançou o objetivo,
    que era melhorar a performance,
  • 0:59 - 1:02
    nós precisamos analisar
    esses dados, o antes e o depois.
  • 1:02 - 1:04
    E é essa a nossa proposta agora.
  • 1:04 - 1:05
    Vamos lá?
  • 1:05 - 1:08
    Aqui eu trago para vocês um resumo.
  • 1:08 - 1:14
    Como é uma hashtag que está aqui marcada,
    não é considerada na execução do código, tá?
  • 1:14 - 1:18
    Então, caso você queira relembrar
    ou queira ter um resumo aí na sua mão,
  • 1:18 - 1:22
    porque às vezes é um material um pouquinho
    extenso, eu deixo aqui para vocês, tá bom?
  • 1:22 - 1:26
    E agora vamos precisar criar a nossa
    situação, o cenário antes e depois.
  • 1:26 - 1:31
    Então nós temos aqui duas linhas
    que nós vamos executar.
  • 1:31 - 1:32
    O que seria isso?
  • 1:32 - 1:35
    Eu vou copiar... Vamos fazer juntos aqui, tá?
  • 1:35 - 1:36
    Como funciona?
  • 1:36 - 1:40
    Deixe-me só tirar aqui esse
    sinalzinho que nós copiamos ali.
  • 1:40 - 1:42
    Aqui é um comentário.
  • 1:42 - 1:45
    "Dados simulados,
    linhas de código por hora
  • 1:45 - 1:49
    antes e depois da introdução dessa
    ferramenta", para melhorar a performance.
  • 1:49 - 1:53
    E aí, para facilitar para vocês,
    vamos deixar alinhados aqui:
  • 1:53 - 1:58
    Hora um, hora dois, hora três,
    hora quatro, hora cinco,
  • 1:58 - 2:01
    hora seis, hora sete, e hora oito.
  • 2:01 - 2:04
    Se você olhar o depois aqui, você
    já consegue ter essa certeza, né,
  • 2:04 - 2:06
    que a performance está sendo melhor.
  • 2:06 - 2:11
    Mas você não deve pensar que sempre
    vai ser um cenário pequeno como esse,
  • 2:11 - 2:15
    num intervalo que você consiga
    analisar apenas olhando para a tela.
  • 2:15 - 2:19
    Pode ser uma base
    com uma análise de 300 horas.
  • 2:19 - 2:22
    Então você precisa sim
    de uma linguagem como o R
  • 2:22 - 2:24
    para fazer essa análise por você, tá?
  • 2:24 - 2:28
    Nós já temos essa certeza, mas
    vamos pedir para o R fazer essa análise?
  • 2:28 - 2:30
    Então primeiro nós vamos
    criar essas variáveis.
  • 2:30 - 2:33
    Vamos imprimir só
    para visualizar, como sempre.
  • 2:33 - 2:39
    Temos que ter uma garantia
    que os dados foram armazenados.
  • 2:39 - 2:42
    "print(linhas_depois)".
  • 2:42 - 2:45
    Não erre, não pode digitar o nome errado,
    senão ele não vai conseguir achar.
  • 2:45 - 2:47
    Eu vou apertar alguns
    Enters aqui para facilitar
  • 2:47 - 2:50
    para ir para o meio da tela
    para visualizarmos.
  • 2:50 - 2:55
    Então, legal, criamos a performance
    das horas antes e depois.
  • 2:55 - 2:59
    Agora nós precisamos
    fazer essa comparação.
  • 2:59 - 3:01
    Será que realmente performou mais?
  • 3:01 - 3:06
    Aqui, novamente, eu deixo um script
    para vocês alguns comentários.
  • 3:06 - 3:09
    Agora nós vamos fazer
    esse teste de hipóteses
  • 3:09 - 3:11
    para verificar
    se a performance aumentou, tá?
  • 3:11 - 3:15
    E aqui, o que eu vou
    interpretar com vocês,
  • 3:15 - 3:18
    eu deixei anotado aqui como
    comentário, um resumo, tá?
  • 3:18 - 3:22
    "Então, qual a instrução, Rafa,
    que vai ser executada agora?".
  • 3:22 - 3:23
    Olha quanto comentário.
  • 3:23 - 3:27
    É para poder entender a saída da execução.
  • 3:27 - 3:30
    "Como fica essa instrução, Rafa?"
  • 3:30 - 3:32
    Vamos apertar mais uns Enters aqui.
  • 3:32 - 3:37
    Agora aqui nós vamos pedir
    para comparar o antes e o depois.
  • 3:37 - 3:38
    Como iremos fazer isso?
  • 3:38 - 3:42
    Temos uma variável aqui
    chamada "resultado_test".
  • 3:42 - 3:45
    Você pode colocar o nome
    que você quiser, como sempre.
  • 3:45 - 3:51
    Aqui nós temos uma primeira instrução,
    que vocês tem que aprender agora: "t.teste".
  • 3:51 - 3:54
    Teste com "t" mudo porque é
    uma instrução em inglês do R.
  • 3:54 - 3:57
    Se vocês buscarem aqui,
    eu deixei anotado aqui
  • 3:57 - 4:01
    para vocês poderem estudar depois
    ou fazer uma anotação, tá?
  • 4:01 - 4:04
    O que é o t.teste?
  • 4:04 - 4:07
    Ele é usado para comparar
    o antes e o depois.
  • 4:07 - 4:13
    É ele que vai fazer essa análise
    dos dados de antes e depois hora a hora.
  • 4:13 - 4:17
    Aqui nós temos temos que fornecer
    o intervalo de valores.
  • 4:17 - 4:19
    Está aqui. Se chama "linha_antes".
  • 4:19 - 4:22
    Qual é o outro intervalo de valores?
  • 4:22 - 4:23
    É o "linha_depois".
  • 4:23 - 4:27
    E aqui, novamente, nós temos
    que fazer uma outra instrução para ele,
  • 4:27 - 4:30
    Nessa instrução, nós vamos dizer assim:
  • 4:30 - 4:32
    "Os dados têm relação?".
  • 4:32 - 4:35
    Sim, é um dado que
    está relacionado diretamente.
  • 4:35 - 4:37
    Eu tenho a informação hora a hora.
  • 4:37 - 4:40
    Eu só não sei
    se realmente aumentou essa performance.
  • 4:40 - 4:44
    Olhando nós sabemos,
    mas supondo que não sabemos ainda.
  • 4:44 - 4:45
    E aí você coloca true
  • 4:45 - 4:49
    ou false, você coloca true
    quando está relacionado diretamente.
  • 4:49 - 4:52
    Às vezes você pode estar querendo
    comparar coisas
  • 4:52 - 4:54
    que elas não estão relacionadas
    diretamente.
  • 4:54 - 4:59
    Aí você colocaria o false, mas
    não no nosso caso aqui vou apertar enter.
  • 5:00 - 5:02
    Aí você fala Poxa, mas e agora?
  • 5:02 - 5:04
    Cadê o resultado?
  • 5:04 - 5:07
    Tudo o que nós iremos analisar agora tá,
  • 5:07 - 5:11
    tá aqui agora você fala Rafa,
    Então vamos imprimir sim, vamos imprimir.
  • 5:11 - 5:13
    Como que a gente faz aqui?
  • 5:13 - 5:19
    Primeiro você já sabe o valor dessa comparação foi armazenado aqui dentro print.
  • 5:20 - 5:21
    Resultado
  • 5:21 - 5:24
    aquela velha história
    cuidado para digitar correta
  • 5:24 - 5:28
    o nome da variável e aí
    nós temos o resultado aqui.
  • 5:28 - 5:32
    Poxa Rafa, parte do resultado
    está escrito em inglês
  • 5:33 - 5:35
    e tem alguns números da estatística. Isso.
  • 5:35 - 5:38
    Agora nós vamos comparar o que eu vou
    explicar para vocês.
  • 5:38 - 5:41
    Eu vou subir um pouquinho novamente
    até conseguir
  • 5:41 - 5:43
    às vezes dar uma pausa,
    fazer a formatação.
  • 5:43 - 5:47
    Nesse momento, eu acho bem rica essa parte
    dessas anotações, desses comentários.
  • 5:47 - 5:51
    É como sempre programar
    deixar o código comentado para você
  • 5:51 - 5:57
    entender o que precisamos focar
    nesse retorno dessa análise,
  • 5:57 - 6:01
    o quanto foi o valor retornado nesse value-p,
  • 6:01 - 6:04
    o que seria esse valor-p e Rafa
    tem aqui para vocês.
  • 6:04 - 6:08
    Se o valor desse P vale,
    o que é esse valor do resultado final?
  • 6:08 - 6:10
    For menor?
  • 6:10 - 6:11
    Eu deixei aqui anotado.
  • 6:11 - 6:16
    Menor que 0,05 menor que 0,05.
  • 6:16 - 6:19
    Sim, esse é um valor menor que 0,05.
  • 6:19 - 6:22
    Ele está mais distante aqui
    do ponto da causa.
  • 6:22 - 6:25
    Quanto mais à direita ele está, mais
    distante, então ele é menor.
  • 6:25 - 6:27
    Significa o quê?
  • 6:27 - 6:32
    Que há realmente uma diferença
    significativa entre o antes e o depois?
  • 6:33 - 6:34
    Ai então o Rafa, como ele é
  • 6:34 - 6:39
    menor que 0,05, que é o que aconteceu
    aqui,
  • 6:39 - 6:43
    quer dizer realmente
    que há uma diferença significativa
  • 6:43 - 6:46
    entre a performance do antes
    e o depois? Sim,
  • 6:46 - 6:50
    então faz sentido a nossa análise
    que nós fizemos sem rodar o código.
  • 6:50 - 6:53
    Então ele refletiu o resultado
    esperado pra nós.
  • 6:53 - 6:54
    Tudo bem.
  • 6:54 - 6:59
    E aí agora a gente conseguiu interpretar
    nesse momento o que você deve se preocupar
  • 6:59 - 7:04
    é esse resultado para ver esse retorno,
    se há realmente essa diferença teoria.
  • 7:04 - 7:05
    Entendeu?
  • 7:05 - 7:08
    Agora nós vamos para uma última parte.
  • 7:08 - 7:13
    Agora nós iremos para a última parte,
    que é verificar não somente
  • 7:13 - 7:18
    se teve realmente significância
    entre a performance do antes e o depois.
  • 7:18 - 7:20
    Isso nós já confirmamos.
  • 7:20 - 7:24
    Agora nós vamos ver a assertividade
    o quanto isso está mais assertivo.
  • 7:24 - 7:26
    Esse retorno que nos deu.
  • 7:26 - 7:30
    Eu lembro a vocês que agora nós fizemos
    com uma base bem pequena de dados,
  • 7:30 - 7:36
    fizemos ali só em 08h00 de análise, hora
    a hora, então oito dados antes e depois.
  • 7:36 - 7:37
    Mas vocês tem sempre que lembrar
  • 7:37 - 7:40
    quando estamos falando aqui
    da ciência do dado, dos dados,
  • 7:40 - 7:44
    pode ser algo muito maior
    uma análise de 300 horas,
  • 7:44 - 7:48
    300 dados antes e 300 depois.
  • 7:48 - 7:52
    Então não tem como você fazer uma análise
    observando apenas os valores.
  • 7:52 - 7:54
    Você tem que pedir para uma ferramenta
  • 7:54 - 7:57
    ou uma linguagem como R
    para fazer isso por você.
  • 7:57 - 8:01
    Vamos ver o quanto realmente está fazendo
    sentido ou A
  • 8:01 - 8:04
    com o nível de confiança desse retorno
    do que foi processado.
  • 8:04 - 8:07
    Vem comigo aqui,
    nós vamos para a última parte.
  • 8:07 - 8:07
    Como sempre,
  • 8:07 - 8:12
    eu deixo aqui para vocês um breve resumo
    para que vocês depois consigo.
  • 8:12 - 8:15
    Até recomendo na sequência
    pausar ou voltar o vídeo
  • 8:15 - 8:20
    para verificar essas observações
    que eu deixei para vocês.
  • 8:20 - 8:22
    Aqui nós vamos fazer duas instruções.
  • 8:22 - 8:25
    Nós temos aqui
    essa primeira que nós vamos pedir para ele
  • 8:25 - 8:28
    calcular e depois para mostrar.
  • 8:28 - 8:31
    Vamos lá, deixa eu copiar aqui para baixo
    ou apertar mais alguns
  • 8:31 - 8:35
    entre os aqui para ficar bem
    dividido a tela para não confundir vocês.
  • 8:35 - 8:38
    Até mesmo aqui eu falo aqui
    essa área que a gente programa,
  • 8:38 - 8:41
    a gente tem que ter um pouco limpa
    para facilitar a interpretação.
  • 8:41 - 8:43
    Agora vou colar aqui para vocês.
  • 8:43 - 8:46
    Deixa eu apagar,
    eu não vou executar sem antes explicar.
  • 8:47 - 8:48
    Então o que nós vamos fazer?
  • 8:48 - 8:51
    Como sempre,
    criar uma variável para receber
  • 8:51 - 8:54
    ou armazenar o valor dessa execução.
  • 8:54 - 8:57
    E aqui nós temos o que o resultado?
  • 8:57 - 8:58
    Underline teste.
  • 8:58 - 8:59
    Que variável é essa?
  • 8:59 - 9:04
    Rafa, eu vou voltar um pouquinho
    o resultado do teste
  • 9:04 - 9:06
    e quando nós pedimos para ele fazer
  • 9:06 - 9:10
    a comparação, lembra do antes
    e o depois que saiu esse resultado?
  • 9:10 - 9:14
    Ah, legal Rafa, Lembre aí
    você fala Rafa, mais uma instrução
  • 9:14 - 9:18
    você vai nos ensinar agora sim,
    essa daqui também conhecido como
  • 9:18 - 9:22
    cifrão ou dólar, como vocês
    queiram falar aí na hora da programação.
  • 9:22 - 9:24
    Conf ponto int.
  • 9:24 - 9:27
    Rafa, esse daí eu ainda não vi com você.
  • 9:27 - 9:27
    Tudo bem?
  • 9:27 - 9:29
    Vamos dar uma olhadinha aqui.
  • 9:29 - 9:33
    Como sempre, eu deixo anotado para vocês
    essas observações
  • 9:33 - 9:37
    para facilitar
    depois na hora da interpretação.
  • 9:38 - 9:40
    Não dei mancada novamente. Está aqui.
  • 9:40 - 9:44
    Então é aquele momento que se eu fosse
    você dava uma pausa no vídeo
  • 9:44 - 9:48
    para deixar anotado no seu caderno
    que é o cofre Ponto int.
  • 9:48 - 9:54
    Ele é usado que para acessar
    o intervalo de confiança da nossa análise
  • 9:54 - 9:57
    de novo,
    nós vamos querer que ele pegue aqui
  • 9:57 - 10:01
    esse resultado
    que foi projetado anteriormente
  • 10:02 - 10:06
    e agora nós vamos projetar
    uma outra execução sobre ele.
  • 10:06 - 10:10
    Olha aqui
    e ele vai gerar uma análise estatística,
  • 10:10 - 10:14
    que é o que a nossa análise
    descritiva legal.
  • 10:14 - 10:19
    Então eu vou pedir para ele
    fazer essa análise, armazenar o valor aqui
  • 10:19 - 10:22
    e aí depois, como sempre,
    nós iremos visualizar ele.
  • 10:23 - 10:26
    Mas você fala Rafa,
    essa visualização não está simples não.
  • 10:26 - 10:31
    Vou trazer mais uma coisa aqui pra nossa
    conversa, para nossa aula de agora
  • 10:31 - 10:37
    é só o texto Intervalo de confiança
    para a diferença média
  • 10:37 - 10:40
    é que nós trouxemos aqui o intervalo
  • 10:40 - 10:44
    onde ele confia carro ou confiança.
  • 10:44 - 10:47
    Um A confiança dois Vou apertar o enter,
  • 10:47 - 10:50
    deixa eu mostrar o resultado
    e vocês vão entender.
  • 10:50 - 10:55
    Então nós temos aqui isso é um texto
    que sai, um texto simples saiu aqui.
  • 10:55 - 11:00
    Esse é um intervalo de confiança de quanto
    a quanto isso é aderência de confiança.
  • 11:01 - 11:02
    Esse é um modelo confiável.
  • 11:02 - 11:07
    Ele vai de -23,56.
  • 11:07 - 11:12
    Aqui é da onde ele parte,
    até aonde ele vai, até aonde ele vai.
  • 11:12 - 11:18
    E dois Percebam que vocês criaram
    a variável com nome intervalo, confiança,
  • 11:18 - 11:20
    da onde ele inicia você coloca um
  • 11:20 - 11:24
    e dá onde ele termina,
    até onde ele vai e o dois.
  • 11:24 - 11:27
    E esse é o intervalo de confiança
    desse modelo de análise
  • 11:27 - 11:30
    que nós acabamos de processar.
  • 11:30 - 11:31
    O que eu espero com isso?
  • 11:31 - 11:34
    Eu espero que agora vocês tenham entendido
    como que é isso,
  • 11:34 - 11:38
    e vamos dizer, real não,
    mas com certeza isso existe.
  • 11:38 - 11:42
    Quando você trabalha uma empresa,
    por exemplo, uma fábrica de software,
  • 11:42 - 11:45
    as vezes a performance da equipe
    não está muito boa no desenvolvimento
  • 11:46 - 11:49
    e aí alguém vai fazer uma análise,
    implementa uma melhoria
  • 11:49 - 11:53
    e depois eles querem medir para saber
    se após a implementação da melhoria
  • 11:53 - 11:55
    a performance da equipe aumentou.
  • 11:55 - 11:58
    E aí,
    quem vai nos ajudar a fazer essa análise?
  • 11:58 - 12:00
    A linguagem é
    com a parte de estatística e.
Title:
DSCR CAP03 2024 VA02 LINGUAGEM R INTERVALOS DE CONFIANCA
Video Language:
Portuguese, Brazilian
Duration:
12:04

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions