< Return to Video

DSCR CAP03 2024 VA05 ESTUDO DE CASO HIPOTESES E INTERVALO

  • 0:08 - 0:08
    Uma das
  • 0:08 - 0:12
    maneiras de se aprender
    é fazendo na prática.
  • 0:12 - 0:15
    E agora nós temos um case para trazer aqui
    que nós iremos
  • 0:15 - 0:20
    conseguir executar
    a partir de hipóteses e intervalos.
  • 0:20 - 0:21
    Pense no cenário.
  • 0:21 - 0:25
    Vocês têm um sistema que o sistema
    não está performando
  • 0:25 - 0:28
    muito bem
    e aí é feita uma análise e colete.
  • 0:28 - 0:29
    São coletados os dados
  • 0:29 - 0:33
    e de hora em hora, quanto
    que está a performance daquele sistema?
  • 0:33 - 0:39
    Então é estudado e verificado que existe
    a possibilidade de se melhorar o algoritmo
  • 0:39 - 0:44
    e implementar essas melhorias do algoritmo
    e posteriormente
  • 0:44 - 0:48
    são coletados novamente os dados
    com relação à performance do sistema.
  • 0:49 - 0:52
    Então você tem o antes e o depois.
  • 0:52 - 0:56
    Se você tem o antes e o depois dos dados,
    você pode comparar.
  • 0:56 - 0:59
    Se for um intervalo bem pequeno,
    talvez você
  • 0:59 - 1:02
    consiga no seu papel ali olhando comparar.
  • 1:02 - 1:05
    Mas imagine uma situação real
    em uma empresa que um sistema
  • 1:05 - 1:09
    fica processando durante 24 horas
    durante um mês.
  • 1:10 - 1:10
    Quanto?
  • 1:10 - 1:14
    Quanto os dados
    você tem ali para fazer essa comparação?
  • 1:14 - 1:18
    Então vamos fazer isso aqui na prática,
    deixar o script pré pronto,
  • 1:18 - 1:21
    sempre daquela maneira,
    deixando essa parte com a hashtag,
  • 1:21 - 1:25
    que é um resumo teórico do que nós
  • 1:25 - 1:28
    iremos analisar,
    até mesmo algumas explicações
  • 1:29 - 1:32
    um pouco mais técnica
    ou com a parte de estatística.
  • 1:32 - 1:34
    Então, aqui nós temos duas bases de dados.
  • 1:34 - 1:35
    Se você apertar um entre,
  • 1:35 - 1:39
    isso vai ser executado, mas a gente
    sempre gosta de fazer na prática.
  • 1:39 - 1:42
    Vamos apertar Ao entrar aqui,
  • 1:42 - 1:46
    nós iremos copiar essas duas
    bases de dados, porque se traz pronto.
  • 1:47 - 1:48
    Não precisa criar agora duas.
  • 1:48 - 1:50
    Dois conjuntos de dados.
  • 1:50 - 1:52
    Ou vou limpar aqui.
  • 1:52 - 1:54
    Vamos interpretar o que nós temos
  • 1:54 - 1:58
    são os dados para análise,
    ou pode tirar isso daqui, o sinalzinho.
  • 1:58 - 2:02
    Então nós temos aqui
    antes da implementação do algoritmo.
  • 2:02 - 2:05
    Vamos supor que nós for
    o que foi analisado.
  • 2:05 - 2:09
    Nós temos aqui um,
    ora um, ora dois, ora três,
  • 2:09 - 2:14
    ora quatro, ora 05h00, 06h07 e hora oito.
  • 2:14 - 2:17
    Então, antes de implementar essa melhoria
    no algoritmo,
  • 2:17 - 2:20
    esses são os valores
    dos tempo de execução.
  • 2:20 - 2:22
    Vamos supor em segundos.
  • 2:22 - 2:24
    E aí foi implementado a melhoria.
  • 2:24 - 2:27
    E aí fez uma nova,
    Fizeram uma nova coleta de dados.
  • 2:27 - 2:30
    E aí, em segundos, quanto tempo demorou?
  • 2:30 - 2:33
    "Se você olhar aqui, Rafa,
    não precisa nem processar.
  • 2:33 - 2:37
    Já fica visível que sim, está melhor."
  • 2:37 - 2:37
    Mas lembre-se que, no dia a dia,
  • 2:39 - 2:40
    você geralmente tem um conjunto
    de dados muito maior.
  • 2:41 - 2:47
    Então, se você for fazer análise no papel,
    você vai demorar muitas horas.
  • 2:47 - 2:50
    E aqui, o mesmo script
    que nós vamos executar agora,
  • 2:50 - 2:55
    serve para um conjunto pequeno de dados
    como esse ou para um conjunto muito maior.
  • 2:55 - 2:57
    Vamos ver como fica.
  • 2:57 - 3:01
    Então nós vamos apertar Enter aqui
    e sempre.
  • 3:01 - 3:03
    Não é obrigatório, mas é sempre legal
  • 3:03 - 3:08
    você visualizar os dados
    para confirmar que está tudo certinho.
  • 3:08 - 3:12
    Criamos o tempo antes
    e pedimos para mostrar o tempo antes.
  • 3:12 - 3:17
    Vamos apertar 2 a 3 aqui, gente,
    vamos mostrar ele de novo.
  • 3:17 - 3:22
    Você pode digitar tempos depois
  • 3:22 - 3:27
    ou você pode utilizar a sugestão dele
    para cima ou apertar enter.
  • 3:27 - 3:30
    Então nós criamos aqui
  • 3:30 - 3:33
    o antes e o depois.
  • 3:33 - 3:33
    Legal!
  • 3:33 - 3:36
    Vamos subir um pouquinho
    então, aqui novamente
  • 3:36 - 3:39
    naquela velha dica
    se tem alguma dúvida das análises
  • 3:39 - 3:42
    que iremos fazer, fica um resumo
    aqui para vocês.
  • 3:42 - 3:44
    Pode pausar e anotar aqui.
  • 3:44 - 3:49
    São os dois dados, os dois conjuntos
    de dados que acabamos de criar.
  • 3:49 - 3:52
    E agora nós vamos para uma próxima parte.
  • 3:52 - 3:55
    Deixa eu pegar, Rafa,
    tem mais comentário aí do que execução.
  • 3:56 - 3:59
    Sim, é sempre legal
    vocês terem esse resumo.
  • 3:59 - 4:02
    Eu gosto deixar um resumo para vocês.
  • 4:02 - 4:06
    Vou dar um repertório entra aqui, tela
    fica um pouco limpo,
  • 4:06 - 4:10
    deixa eu só arrumar aqui
    só um minuto que nós temos aqui.
  • 4:10 - 4:12
    Rafa.
  • 4:12 - 4:14
    Porque voltando a primeira
  • 4:14 - 4:17
    que é o título,
    realizando o teste de hipóteses.
  • 4:17 - 4:22
    E aí, aqui nós temos o que nós queremos
    analisar, eu vou apertar o entre,
  • 4:22 - 4:25
    vou imprimir e aí nós vamos interpretando,
    iremos interpretar junto.
  • 4:25 - 4:29
    Tudo bem,
    para teste um de lá na hipótese legal.
  • 4:29 - 4:33
    Que construção que é essa, Rafa, que vocês
    escutou e você ainda não ensinou?
  • 4:33 - 4:35
    Vamos tentar entender o que está aqui.
  • 4:35 - 4:38
    Vamos tentar? Não vamos entender, né?
  • 4:38 - 4:42
    Teste anterior Hipótese é um nome
    de uma variável, aí sinal de menor assim.
  • 4:42 - 4:47
    Então o que acontecer aqui
    será atribuído para dentro desse
  • 4:47 - 4:51
    essa variável tender lá teste
  • 4:51 - 4:54
    e mais um tema que vocês precisam
    aprender.
  • 4:54 - 4:56
    O que seria isso?
  • 4:56 - 4:58
    Oh, ele é usado.
  • 4:58 - 5:01
    Ele é mais usado
    para comparar a média de dois grupos
  • 5:01 - 5:06
    e determinar estatisticamente
    se há diferença entre eles.
  • 5:06 - 5:09
    Então nós não temos duas bases de dados.
  • 5:09 - 5:14
    Oh, vamos lembrar que a base de dados da
    análise da performance do sistema do antes
  • 5:14 - 5:19
    e a análise dos dados com a base de dados
    do depois com a performance.
  • 5:19 - 5:20
    Se você olhar
  • 5:20 - 5:23
    1A1, se vai ver que está melhor mesmo.
  • 5:23 - 5:26
    Mas vamos deixar para o R fazer isso
    para nós.
  • 5:26 - 5:28
    Então
    nós temos que fornecer a base de dados,
  • 5:28 - 5:32
    o conjunto de dados do antes e do depois.
  • 5:32 - 5:37
    E aqui o que a gente faz
    é uma instrução para dizer que nós estamos
  • 5:37 - 5:41
    fazendo uma comparação com essas duas,
    com duas bases de dados.
  • 5:41 - 5:45
    Rafa Poderíamos fazer uma análise
    com mais base de dados?
  • 5:45 - 5:46
    Sim, poderíamos.
  • 5:46 - 5:49
    Aqui nós só estamos comparando duas.
  • 5:49 - 5:53
    E aí você fala Nossa, Rafa,
    saiu um resultado aí um pouquinho extenso.
  • 5:53 - 5:55
    Calma aí que nós iremos interpretar ele.
  • 5:55 - 5:58
    Tudo bem? Vem aqui comigo, por favor.
  • 5:58 - 5:59
    Então o que nós fizemos?
  • 5:59 - 6:01
    Estamos indo interpretar aquele resultado
  • 6:01 - 6:06
    que estão os comentários,
    os dados do antes e do depois.
  • 6:06 - 6:08
    Uma primeira,
  • 6:08 - 6:12
    primeira,
    o teste de hipótese que nós fizemos.
  • 6:12 - 6:15
    E aqui nós vamos imprimir esse resultado
    do teste, hipótese
  • 6:15 - 6:16
    que é o que a gente acabou de fazer.
  • 6:16 - 6:20
    Vou deixar só comentado,
    mas vai se fazer a mesma saída, tá?
  • 6:20 - 6:22
    Então
  • 6:22 - 6:24
    o que nós temos aqui?
  • 6:24 - 6:26
    Como que a gente pode interpretar?
  • 6:26 - 6:29
    Você só mandou imprimir e colocou o título
    aqui, que é o resto entregue.
  • 6:30 - 6:35
    E aí você tem que novamente focar
    na análise da saída dos dados.
  • 6:35 - 6:40
    Tem esse p value aqui,
    que é um dos focos da nossa análise.
  • 6:40 - 6:43
    Se vocês voltarem aqui para o começo,
  • 6:43 - 6:46
    vocês podem tirar algumas análise
  • 6:46 - 6:50
    do que a gente está buscando
    ou os intervalos de confiança.
  • 6:50 - 6:54
    Usado para estimar a incerteza associada
    a uma estimativa pontual.
  • 6:54 - 6:59
    O quanto a gente tem a certeza
    ou incerteza que isso está nos ajudando.
  • 7:00 - 7:03
    Então, aqui nós conseguimos fazer
    com que a linguagem R
  • 7:03 - 7:06
    fizesse essa análise do tempo,
    o antes e o depois,
  • 7:07 - 7:10
    olhando antes da execução,
    nós conseguimos ter a certeza.
  • 7:10 - 7:13
    Mas lembre se sempre no dia
    a dia do seu trabalho,
  • 7:13 - 7:16
    na sua vida pessoal,
    você vai precisar analisar dados
  • 7:16 - 7:21
    que geralmente esse conjunto de dados
    é muito maior.
  • 7:21 - 7:25
    Então utilize o R
    para que faça essa análise por você.
  • 7:25 - 7:30
    E agora fica uma dica pense em um cenário,
    algo da sua vida pessoal
  • 7:30 - 7:34
    ou de algum familiar seu,
    ou até mesmo da sua empresa que você tem
  • 7:34 - 7:39
    esse conjunto de dados do antes e o depois
    e você precisa fazer essa análise,
  • 7:39 - 7:42
    de preferência
    um conjunto de dados até maior,
  • 7:42 - 7:46
    e aí você tente executar esse
    script novamente,
  • 7:46 - 7:50
    buscando essa análise nos comentários
    e você consiga chegar no seu resultado.
  • 7:50 - 7:53
    Então você
    terá certeza que fazendo na prática
  • 7:53 - 7:57
    você consegue
    absorver esse conhecimento e.
Title:
DSCR CAP03 2024 VA05 ESTUDO DE CASO HIPOTESES E INTERVALO
Video Language:
Portuguese, Brazilian
Duration:
08:00

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions