< Return to Video

DSCR CAP03 2024 VA05 ESTUDO DE CASO HIPOTESES E INTERVALO

  • 0:08 - 0:12
    Uma das maneiras
    de se aprender é na prática.
  • 0:12 - 0:15
    E agora nós temos um case para trazer aqui
  • 0:15 - 0:20
    onde nós iremos conseguir executar
    a partir de hipóteses e intervalos.
  • 0:20 - 0:21
    Pense no cenário:
  • 0:21 - 0:26
    vocês têm um sistema que não
    está performando muito bem,
  • 0:26 - 0:31
    e aí é feita uma análise, são
    coletados os dados de hora em hora
  • 0:31 - 0:33
    para saber como está
    a performance daquele sistema.
  • 0:33 - 0:38
    Então é estudado e verificado que existe
    a possibilidade de se melhorar o algoritmo,
  • 0:39 - 0:44
    Essas melhorias do algoritmo
    são implementadas, e, posteriormente,
  • 0:44 - 0:49
    são novamente coletados os dados
    com relação à performance do sistema.
  • 0:49 - 0:52
    Então você tem o antes e o depois.
  • 0:52 - 0:56
    Se você tem o antes e o depois
    dos dados, você pode comparar.
  • 0:56 - 1:02
    Se for um intervalo bem pequeno,
    talvez você consiga comparar olhando.
  • 1:02 - 1:05
    Mas imagine numa situação
    real em uma empresa,
  • 1:05 - 1:09
    onde um sistema fica processando
    durante 24 horas durante um mês,
  • 1:09 - 1:14
    quantos dados você tem ali
    para fazer essa comparação?
  • 1:14 - 1:16
    Então vamos fazer isso aqui na prática.
  • 1:16 - 1:19
    Eu deixei um script pré-pronto,
    sempre daquela maneira,
  • 1:19 - 1:21
    deixando essa parte com a hashtag,
  • 1:21 - 1:26
    que é um resumo teórico
    do que nós iremos analisar,
  • 1:26 - 1:30
    até mesmo algumas explicações
    um pouco mais técnicas,
  • 1:30 - 1:32
    ou com a parte de estatística.
  • 1:32 - 1:34
    Então aqui nós temos duas bases de dados.
  • 1:34 - 1:36
    Se apertarmos um Enter,
    isso vai ser executado.
  • 1:36 - 1:39
    Mas sempre gostamos de fazer na prática.
  • 1:39 - 1:44
    Vamos apertar o Enter aqui, e iremos
    copiar essas duas bases de dados.
  • 1:44 - 1:47
    "Rafa, por que você traz pronto?"
  • 1:47 - 1:50
    Para não precisar criar agora
    dois conjuntos de dados.
  • 1:50 - 1:52
    Eu vou limpar aqui.
  • 1:52 - 1:54
    Vamos interpretar o que nós temos, tá?
  • 1:54 - 1:55
    Olhe, esses são os dados para a análise.
  • 1:55 - 1:58
    Opa! Vou tirar esse sinalzinho aqui.
  • 1:58 - 2:02
    Então, antes da implementação
    do algoritmo,
  • 2:02 - 2:05
    vamos supor que foi analisado.
  • 2:05 - 2:10
    Nós temos aqui a hora um,
    hora dois, hora três, hora quatro,
  • 2:10 - 2:14
    hora cinco, hora seis,
    hora sete, e hora oito.
  • 2:14 - 2:17
    Então, antes de implementar
    essa melhoria no algoritmo,
  • 2:17 - 2:20
    esses eram os valores
    dos tempos de execução.
  • 2:20 - 2:22
    Vamos supor em segundos?
  • 2:22 - 2:27
    E aí foi implementada a melhoria
    e fizeram uma nova coleta de dados.
  • 2:27 - 2:30
    E aí, em segundos, quanto tempo demorou.
  • 2:30 - 2:33
    "Se você olhar aqui, Rafa,
    não precisa nem processar.
  • 2:33 - 2:37
    Já fica visível que sim, está melhor."
  • 2:37 - 2:39
    Mas lembre-se que, no dia a dia,
  • 2:39 - 2:41
    você geralmente tem um conjunto
    de dados muito maior.
  • 2:41 - 2:47
    Então, se você for fazer análise no papel,
    você vai demorar muitas horas.
  • 2:47 - 2:50
    E aqui, o mesmo script
    que nós vamos executar agora,
  • 2:50 - 2:55
    serve para um conjunto pequeno de dados
    como esse ou para um conjunto muito maior.
  • 2:55 - 2:57
    Vamos ver como fica.
  • 2:57 - 3:00
    Então nós vamos apertar um Enter.
  • 3:01 - 3:05
    Não é obrigatório, mas é sempre
    legal você visualizar os dados
  • 3:05 - 3:08
    para confirmar que está tudo certinho.
  • 3:08 - 3:12
    Criamos o tempo antes e pedimos
    para mostrar o tempo antes.
  • 3:12 - 3:14
    Vamos apertar dois Enters aqui.
  • 3:14 - 3:17
    Print, e vamos mostrá-lo.
  • 3:17 - 3:22
    De novo, você pode digitar tempos_depois
  • 3:22 - 3:26
    ou você pode utilizar a sugestão dele,
    olhe, para cima, e vou apertar o Enter.
  • 3:27 - 3:32
    Então nós criamos aqui o antes e o depois.
  • 3:32 - 3:33
    Legal!
  • 3:33 - 3:35
    Vamos subir um pouquinho.
  • 3:35 - 3:37
    Então novamente, aquela velha dica:
  • 3:37 - 3:40
    se tem alguma dúvida
    das análises que iremos fazer,
  • 3:40 - 3:42
    fica um resumo aqui para vocês.
  • 3:42 - 3:44
    Pode pausar e anotar.
  • 3:44 - 3:49
    Aqui são os dois dados, os dois conjuntos
    de dados, que acabamos de criar.
  • 3:49 - 3:52
    E agora nós vamos para uma próxima parte.
  • 3:53 - 3:56
    "Rafa, tem mais comentário
    aí do que execução."
  • 3:56 - 3:59
    Sim, é sempre legal
    vocês terem esse resumo.
  • 3:59 - 4:02
    Eu gosto de deixar um resumo para vocês.
  • 4:02 - 4:06
    Eu vou dar um Enter aqui
    para a tela ficar um pouco limpa.
  • 4:06 - 4:07
    Deixe-me só arrumar aqui.
  • 4:07 - 4:09
    Só um minuto.
  • 4:09 - 4:11
    O que nós temos aqui?
  • 4:13 - 4:17
    A primeira aqui é o título, né,
    "realizando o teste de hipóteses".
  • 4:17 - 4:21
    E aqui nós temos o que nós
    queremos analisar.
  • 4:21 - 4:26
    Eu vou apertar o Enter e vou imprimir,
    e aí nós vamos interpretar juntos, tudo bem?
  • 4:26 - 4:27
    "teste_hipotese".
  • 4:29 - 4:33
    "Que construção é essa, Rafa, que você
    executou e ainda não ensinou?"
  • 4:33 - 4:35
    Vamos tentar entender o que está aqui.
  • 4:35 - 4:36
    Vamos tentar, não.
  • 4:36 - 4:38
    Vamos entender, né?
  • 4:38 - 4:41
    teste_hipotese" é
    um nome de uma variável.
  • 4:41 - 4:42
    Aí sinal de menor, tracinho.
  • 4:42 - 4:48
    Então o que acontecer aqui será
    atribuído para dentro dessa variável.
  • 4:49 - 4:54
    "t.test" é mais um tema
    que vocês precisam aprender.
  • 4:54 - 4:56
    O que seria isso?
  • 4:56 - 5:01
    Ele é mais usado para comparar
    a média de dois grupos
  • 5:01 - 5:06
    e determinar estatisticamente
    se há diferença entre eles.
  • 5:06 - 5:09
    Então nós não temos duas bases de dados?
  • 5:09 - 5:14
    Vamos lembrar: base de dados da análise
    da performance do sistema do antes
  • 5:14 - 5:18
    e a análise dos dados com a base de dados
    do depois com a performance.
  • 5:19 - 5:23
    Se você olhar um a um, você
    vai ver que está melhor mesmo.
  • 5:23 - 5:26
    Mas vamos deixar o R fazer isso para nós.
  • 5:26 - 5:28
    Então nós temos que fornecer
    a base de dados,
  • 5:28 - 5:32
    o conjunto de dados do antes e do depois.
  • 5:32 - 5:38
    E aqui nós fazemos uma instrução
    para dizer que nós estamos fazendo
  • 5:38 - 5:41
    uma comparação com duas bases de dados.
  • 5:41 - 5:45
    "Rafa, poderíamos fazer uma análise
    com mais base de dados?"
  • 5:45 - 5:46
    Sim, poderíamos.
  • 5:46 - 5:49
    Aqui nós só estamos comparando duas.
  • 5:49 - 5:53
    E aí você fala: "Nossa, Rafa, saiu
    um resultado um pouquinho extenso."
  • 5:53 - 5:56
    Calma aí que nós iremos
    interpretá-lo, tudo bem?
  • 5:56 - 5:58
    Vem aqui comigo, por favor.
  • 5:58 - 5:59
    O que nós fizemos então?
  • 5:59 - 6:01
    Nós ainda precisamos
    interpretar aquele resultado, né?
  • 6:01 - 6:05
    Aqui estão os comentários,
    os dados do antes e do depois...
  • 6:08 - 6:12
    Um primeiro teste
    de hipótese que nós fizemos,
  • 6:12 - 6:15
    e aqui nós vamos imprimir esse
    resultado do teste de hipótese,
  • 6:15 - 6:16
    que é o que acabamos de fazer.
  • 6:16 - 6:19
    Vou deixar só comentado, mas
    vai se fazer a mesma saída, tá?
  • 6:22 - 6:24
    O que nós temos aqui então?
  • 6:24 - 6:26
    "Como podemos interpretar, Rafa?
  • 6:26 - 6:29
    Você só mandou imprimir e colocou
    um título aqui, que é a hashtag."
  • 6:30 - 6:35
    Aí você tem que novamente focar
    na análise da saída dos dados.
  • 6:35 - 6:40
    Tem esse p-value aqui, que é
    um dos focos da nossa análise.
  • 6:40 - 6:43
    Se vocês voltarem para o começo aqui,
  • 6:43 - 6:48
    vocês podem tirar algumas análises
    do que estamos buscando, né?
  • 6:48 - 6:50
    Olhe: "Os intervalos
    de confiança são usados
  • 6:50 - 6:54
    para estimar a incerteza associada
    a uma estimativa pontual".
  • 6:54 - 6:59
    O quanto temos a certeza,
    ou incerteza, que isso está nos ajudando.
  • 6:59 - 7:03
    Então nós conseguimos fazer
    com que a linguagem R
  • 7:03 - 7:07
    fizesse essa análise do tempo
    o antes e do depois.
  • 7:07 - 7:10
    Olhando antes da execução,
    nós conseguimos ter a certeza.
  • 7:10 - 7:13
    Mas lembre-se sempre
    no dia a dia do seu trabalho,
  • 7:13 - 7:16
    na sua vida pessoal, que você
    vai precisar analisar dados
  • 7:16 - 7:21
    onde geralmente esse conjunto
    de dados é muito maior.
  • 7:21 - 7:25
    Então utilize o R para que faça
    essa análise por você.
  • 7:25 - 7:27
    E agora fica uma dica:
    pense em um cenário,
  • 7:27 - 7:33
    algo da sua vida pessoal ou de algum
    familiar seu, ou até mesmo da sua empresa,
  • 7:33 - 7:37
    onde você tenha esse conjunto
    de dados do antes e do depois,
  • 7:37 - 7:39
    e você precisa fazer essa análise,
  • 7:39 - 7:42
    de preferência um conjunto
    de dados até maior.
  • 7:42 - 7:46
    E aí tente executar esse script novamente
  • 7:46 - 7:50
    buscando essa análise dos comentários,
    e tente chegar no seu resultado.
  • 7:50 - 7:53
    Então você terá certeza que, na prática,
  • 7:53 - 7:56
    você consegue absorver
    esse conhecimento.
Title:
DSCR CAP03 2024 VA05 ESTUDO DE CASO HIPOTESES E INTERVALO
Video Language:
Portuguese, Brazilian
Duration:
08:00

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions