< Return to Video

DSCR CAP03 2024 VA05 ESTUDO DE CASO HIPOTESES E INTERVALO

  • 0:08 - 0:12
    Uma das maneiras
    de se aprender é na prática.
  • 0:12 - 0:15
    E agora nós temos um case para trazer aqui
  • 0:15 - 0:20
    onde nós iremos conseguir executar
    a partir de hipóteses e intervalos.
  • 0:20 - 0:21
    Pense no cenário:
  • 0:21 - 0:26
    vocês têm um sistema que
    não está performando muito bem,
  • 0:26 - 0:30
    e aí é feita uma análise, são
    coletados os dados de hora em hora
  • 0:30 - 0:33
    para saber como está
    a performance daquele sistema.
  • 0:33 - 0:38
    Então é estudado e verificado que existe
    a possibilidade de se melhorar o algoritmo,
  • 0:39 - 0:44
    Essas melhorias do algoritmo
    são implementadas, e, posteriormente,
  • 0:44 - 0:49
    são novamente coletados os dados
    com relação à performance do sistema.
  • 0:49 - 0:52
    Então você tem o antes e o depois.
  • 0:52 - 0:56
    Se você tem o antes e o depois
    dos dados, você pode comparar.
  • 0:56 - 1:02
    Se for um intervalo bem pequeno,
    talvez você consiga comparar olhando.
  • 1:02 - 1:05
    Mas imagine numa situação
    real em uma empresa,
  • 1:05 - 1:09
    onde um sistema fica processando
    durante 24 horas durante um mês,
  • 1:09 - 1:14
    quantos dados você tem ali
    para fazer essa comparação?
  • 1:14 - 1:16
    Então vamos fazer isso aqui na prática.
  • 1:16 - 1:19
    Eu deixei um script pré-pronto,
    sempre daquela maneira,
  • 1:19 - 1:21
    deixando essa parte com a hashtag,
  • 1:21 - 1:26
    que é um resumo teórico
    do que nós iremos analisar,
  • 1:26 - 1:30
    até mesmo algumas explicações
    um pouco mais técnicas,
  • 1:30 - 1:32
    ou com a parte de estatística.
  • 1:32 - 1:34
    Então, aqui nós temos duas bases de dados.
  • 1:34 - 1:36
    Se apertarmos um Enter,
    isso vai ser executado.
  • 1:36 - 1:39
    Mas sempre gostamos de fazer na prática.
  • 1:39 - 1:44
    Vamos apertar o Enter aqui, e iremos
    copiar essas duas bases de dados.
  • 1:44 - 1:47
    "Rafa, por que você traz pronto?"
  • 1:47 - 1:50
    Para não precisar criar agora
    dois conjuntos de dados.
  • 1:50 - 1:52
    Eu vou limpar aqui.
  • 1:52 - 1:54
    Vamos interpretar o que nós temos, tá?
  • 1:54 - 1:55
    Olhe, esses são os dados para a análise.
  • 1:55 - 1:58
    Opa! Vou tirar esse sinalzinho aqui.
  • 1:58 - 2:02
    Então, antes da implementação
    do algoritmo,
  • 2:02 - 2:05
    vamos supor que foi analisado.
  • 2:05 - 2:10
    Nós temos aqui a hora um,
    hora dois, hora três, hora quatro,
  • 2:10 - 2:14
    hora cinco, hora seis,
    hora sete, e hora oito.
  • 2:14 - 2:17
    Então, antes de implementar
    essa melhoria no algoritmo,
  • 2:17 - 2:20
    esses eram os valores
    dos tempos de execução.
  • 2:20 - 2:22
    Vamos supor em segundos?
  • 2:22 - 2:27
    E aí foi implementada a melhoria
    e fizeram uma nova coleta de dados.
  • 2:27 - 2:30
    E aí, em segundos, quanto tempo demorou.
  • 2:30 - 2:33
    "Se você olhar aqui, Rafa,
    não precisa nem processar.
  • 2:33 - 2:37
    Já fica visível que sim, está melhor."
  • 2:37 - 2:37
    Mas lembre-se que, no dia a dia,
  • 2:39 - 2:40
    você geralmente tem um conjunto
    de dados muito maior.
  • 2:41 - 2:47
    Então, se você for fazer análise no papel,
    você vai demorar muitas horas.
  • 2:47 - 2:50
    E aqui, o mesmo script
    que nós vamos executar agora,
  • 2:50 - 2:55
    serve para um conjunto pequeno de dados
    como esse ou para um conjunto muito maior.
  • 2:55 - 2:57
    Vamos ver como fica.
  • 2:57 - 3:01
    Então nós vamos apertar
    Enter aqui, como sempre.
  • 3:01 - 3:03
    Não é obrigatório, mas é sempre
    legal você visualizar os dados
  • 3:03 - 3:08
    para confirmar que está tudo certinho.
  • 3:08 - 3:12
    Criamos o tempo antes e pedimos
    para mostrar o tempo antes.
  • 3:12 - 3:17
    Vamos apertar 2 a 3 aqui, gente,
    vamos mostrá-lo de novo.
  • 3:17 - 3:22
    Você pode digitar tempos_depois
  • 3:22 - 3:27
    ou você pode utilizar a sugestão dele
    para cima, ou apertar Enter.
  • 3:27 - 3:30
    Então nós criamos aqui o antes e o depois.
  • 3:33 - 3:33
    Legal!
  • 3:33 - 3:36
    Vamos subir um pouquinho
    então novamente aqui.
  • 3:36 - 3:39
    Aquela velha dica: se tem alguma
    dúvida das análises que iremos fazer,
  • 3:39 - 3:42
    fica um resumo aqui para vocês.
  • 3:42 - 3:44
    Pode pausar e anotar aqui.
  • 3:44 - 3:49
    São os dois dados, os dois conjuntos
    de dados, que acabamos de criar.
  • 3:49 - 3:52
    E agora nós vamos para uma próxima parte.
  • 3:52 - 3:55
    "Deixe-me pegar, Rafa.
  • 3:55 - 3:56
    Tem mais comentário aí do que execução.
  • 3:56 - 3:59
    Sim, é sempre legal
    vocês terem esse resumo.
  • 3:59 - 4:02
    Eu gosto de deixar um resumo para vocês.
  • 4:02 - 4:06
    Eu vou dar um Enter aqui
    para a tela ficar um pouco limpa.
  • 4:06 - 4:10
    Deixe-me só arrumar aqui
    só um minuto que nós temos aqui.
  • 4:10 - 4:12
    Rafa.
  • 4:12 - 4:14
    Porque voltando a primeira, que é o título,
    realizando o teste de hipóteses.
  • 4:17 - 4:22
    E aí, aqui nós temos
    o que nós queremos analisar.
  • 4:22 - 4:25
    Eu vou apertar o Enter, vou imprimir,
    e aí nós vamos interpretar juntos, tudo bem?
  • 4:25 - 4:29
    Para teste um de lá na hipótese legal.
  • 4:29 - 4:33
    Que construção é essa, Rafa, que vocês
    escutou e você ainda não ensinou?
  • 4:33 - 4:35
    Vamos tentar entender o que está aqui.
  • 4:35 - 4:38
    Vamos tentar? Não vamos entender, né?
  • 4:38 - 4:42
    Teste anterior Hipótese é um nome
    de uma variável, aí sinal de menor assim.
  • 4:42 - 4:47
    Então o que acontecer aqui
    será atribuído para dentro desse
  • 4:47 - 4:51
    essa variável tender lá teste.
  • 4:51 - 4:54
    É mais um tema que vocês
    precisam aprender.
  • 4:54 - 4:56
    O que seria isso?
  • 4:56 - 4:58
    Oh, ele é usado.
  • 4:58 - 5:01
    Ele é mais usado para comparar
    a média de dois grupos
  • 5:01 - 5:06
    e determinar estatisticamente
    se há diferença entre eles.
  • 5:06 - 5:09
    Então nós não temos duas bases de dados.
  • 5:09 - 5:14
    Vamos lembrar que é a base de dados
    da análise da performance do sistema do antes
  • 5:14 - 5:19
    e a análise dos dados com a base de dados
    do depois com a performance.
  • 5:19 - 5:20
    Se você olhar um a um, você
    vai ver que está melhor mesmo.
  • 5:23 - 5:26
    Mas vamos deixar o R fazer isso para nós.
  • 5:26 - 5:28
    Então nós temos que fornecer
    a base de dados,
  • 5:28 - 5:32
    o conjunto de dados do antes e do depois.
  • 5:32 - 5:37
    E aqui nós fazemos uma instrução
    para dizer que nós estamos fazendo
  • 5:37 - 5:41
    uma comparação com duas bases de dados.
  • 5:41 - 5:45
    "Rafa, poderíamos fazer uma análise
    com mais base de dados?"
  • 5:45 - 5:46
    Sim, poderíamos.
  • 5:46 - 5:49
    Aqui nós só estamos comparando duas.
  • 5:49 - 5:53
    E aí você fala: "Nossa, Rafa, saiu
    um resultado um pouquinho extenso."
  • 5:53 - 5:55
    Calma aí que nós iremos
    interpretá-lo, tudo bem?
  • 5:55 - 5:58
    Vem aqui comigo, por favor.
  • 5:58 - 5:59
    O que nós fizemos então?
  • 5:59 - 6:01
    Estamos indo interpretar aquele
    resultado onde estão os comentários,
  • 6:01 - 6:06
    os dados do antes e do depois,
  • 6:08 - 6:12
    um primeiro teste
    de hipótese que nós fizemos.
  • 6:12 - 6:15
    E aqui nós vamos imprimir esse
    resultado do teste de hipótese,
  • 6:15 - 6:16
    que é o que acabamos de fazer.
  • 6:16 - 6:20
    Vou deixar só comentado, mas
    vai se fazer a mesma saída, tá?
  • 6:22 - 6:24
    O que nós temos aqui então?
  • 6:24 - 6:26
    Como podemos interpretar?
  • 6:26 - 6:29
    "Você só mandou imprimir e colocou
    o título aqui, que é o resto entregue."
  • 6:30 - 6:35
    E aí você tem que novamente focar
    na análise da saída dos dados.
  • 6:35 - 6:40
    Tem esse p-value aqui, que é
    um dos focos da nossa análise.
  • 6:40 - 6:43
    Se vocês voltarem para o começo aqui,
  • 6:43 - 6:46
    vocês podem tirar algumas análises
    do que estamos buscando,
  • 6:46 - 6:50
    os intervalos de confiança,
  • 6:50 - 6:54
    usados para estimar a incerteza
    associada à uma estimativa pontual.
  • 6:54 - 6:59
    O quanto temos a certeza,
    ou incerteza, que isso está nos ajudando.
  • 7:00 - 7:03
    Então nós conseguimos fazer
    com que a linguagem R
  • 7:03 - 7:06
    fizesse essa análise do tempo,
    o antes e o depois.
  • 7:07 - 7:10
    Olhando antes da execução,
    nós conseguimos ter a certeza.
  • 7:10 - 7:13
    Mas lembre-se sempre
    no dia a dia do seu trabalho,
  • 7:13 - 7:16
    na sua vida pessoal, que você
    vai precisar analisar dados
  • 7:16 - 7:21
    onde geralmente esse conjunto
    de dados é muito maior.
  • 7:21 - 7:25
    Então utilize o R para que faça
    essa análise por você.
  • 7:25 - 7:30
    E agora fica uma dica:
    pense em um cenário,
  • 7:30 - 7:34
    algo da sua vida pessoal ou de algum
    familiar seu, ou até mesmo da sua empresa,
  • 7:34 - 7:38
    que você tem esse conjunto
    de dados do antes e o depois,
  • 7:38 - 7:39
    e você precisa fazer essa análise,
  • 7:39 - 7:42
    de preferência
    um conjunto de dados até maior,
  • 7:42 - 7:46
    e aí tente executar esse script novamente,
  • 7:46 - 7:50
    buscando essa análise nos comentários,
    e tente chegar no seu resultado.
  • 7:50 - 7:53
    Então você terá certeza que, na prática,
  • 7:53 - 7:57
    você consegue absorver
    esse conhecimento.
Title:
DSCR CAP03 2024 VA05 ESTUDO DE CASO HIPOTESES E INTERVALO
Video Language:
Portuguese, Brazilian
Duration:
08:00

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions