Uma das maneiras
de se aprender é na prática.
E agora nós temos um case para trazer aqui
onde nós iremos conseguir executar
a partir de hipóteses e intervalos.
Pense no cenário:
vocês têm um sistema que
não está performando muito bem,
e aí é feita uma análise e coleta.
São coletados os dados de hora em hora,
para saber como está
a performance daquele sistema.
Então é estudado e verificado que existe
a possibilidade de se melhorar o algoritmo,
implementar essas melhorias
do algoritmo, e, posteriormente,
são coletados novamente os dados
com relação à performance do sistema.
Então você tem o antes e o depois.
Se você tem o antes e o depois
dos dados, você pode comparar.
Se for um intervalo bem pequeno,
talvez você consiga comparar olhando.
Mas imagine uma situação
real em uma empresa
onde um sistema fica processando
durante 24 horas durante um mês.
Quantos dados você tem ali
para fazer essa comparação?
Então vamos fazer isso aqui na prática,
deixar o script pré-pronto,
sempre daquela maneira,
deixando essa parte com a hashtag,
que é um resumo teórico
do que nós iremos analisar,
até mesmo algumas explicações um pouco
mais técnicas, ou com a parte de estatística.
Então, aqui nós temos duas bases de dados.
Se você apertar um Enter,
isso vai ser executado.
Mas sempre gostamos de fazer na prática.
Vamos apertar Ao entrar aqui,
iremos copiar essas duas
bases de dados, porque se traz pronto.
Não precisa criar agora
dois conjuntos de dados.
Eu vou limpar aqui.
Vamos interpretar o que nós temos
são os dados para análise,
ou pode tirar isso daqui, o sinalzinho.
Então nós temos aqui
antes da implementação do algoritmo.
Vamos supor que nós for
o que foi analisado.
Nós temos aqui hora um,
hora um, hora dois, hora três,
hora quatro, hora cinco,
hora seis, hora sete, e hora oito.
Então, antes de implementar
essa melhoria no algoritmo,
esses são os valores
dos tempo de execução.
Vamos supor que em segundos.
E aí foi implementada a melhoria.
E aí fizeram uma nova coleta de dados.
Em segundos, quanto tempo demorou?
"Se você olhar aqui, Rafa,
não precisa nem processar.
Já fica visível que sim, está melhor."
Mas lembre-se que, no dia a dia,
você geralmente tem um conjunto
de dados muito maior.
Então, se você for fazer análise no papel,
você vai demorar muitas horas.
E aqui, o mesmo script
que nós vamos executar agora,
serve para um conjunto pequeno de dados
como esse ou para um conjunto muito maior.
Vamos ver como fica.
Então nós vamos apertar
Enter aqui, como sempre.
Não é obrigatório, mas é sempre
legal você visualizar os dados
para confirmar que está tudo certinho.
Criamos o tempo antes e pedimos
para mostrar o tempo antes.
Vamos apertar 2 a 3 aqui, gente,
vamos mostrá-lo de novo.
Você pode digitar tempos_depois
ou você pode utilizar a sugestão dele
para cima, ou apertar Enter.
Então nós criamos aqui o antes e o depois.
Legal!
Vamos subir um pouquinho
então novamente aqui.
Aquela velha dica: se tem alguma
dúvida das análises que iremos fazer,
fica um resumo aqui para vocês.
Pode pausar e anotar aqui.
São os dois dados, os dois conjuntos
de dados, que acabamos de criar.
E agora nós vamos para uma próxima parte.
"Deixe-me pegar, Rafa.
Tem mais comentário aí do que execução.
Sim, é sempre legal
vocês terem esse resumo.
Eu gosto de deixar um resumo para vocês.
Eu vou dar um Enter aqui
para a tela ficar um pouco limpa.
Deixe-me só arrumar aqui
só um minuto que nós temos aqui.
Rafa.
Porque voltando a primeira, que é o título,
realizando o teste de hipóteses.
E aí, aqui nós temos
o que nós queremos analisar.
Eu vou apertar o Enter, vou imprimir,
e aí nós vamos interpretar juntos, tudo bem?
Para teste um de lá na hipótese legal.
Que construção é essa, Rafa, que vocês
escutou e você ainda não ensinou?
Vamos tentar entender o que está aqui.
Vamos tentar? Não vamos entender, né?
Teste anterior Hipótese é um nome
de uma variável, aí sinal de menor assim.
Então o que acontecer aqui
será atribuído para dentro desse
essa variável tender lá teste.
É mais um tema que vocês
precisam aprender.
O que seria isso?
Oh, ele é usado.
Ele é mais usado para comparar
a média de dois grupos
e determinar estatisticamente
se há diferença entre eles.
Então nós não temos duas bases de dados.
Vamos lembrar que é a base de dados
da análise da performance do sistema do antes
e a análise dos dados com a base de dados
do depois com a performance.
Se você olhar um a um, você
vai ver que está melhor mesmo.
Mas vamos deixar o R fazer isso para nós.
Então nós temos que fornecer
a base de dados,
o conjunto de dados do antes e do depois.
E aqui nós fazemos uma instrução
para dizer que nós estamos fazendo
uma comparação com duas bases de dados.
"Rafa, poderíamos fazer uma análise
com mais base de dados?"
Sim, poderíamos.
Aqui nós só estamos comparando duas.
E aí você fala: "Nossa, Rafa, saiu
um resultado um pouquinho extenso."
Calma aí que nós iremos
interpretá-lo, tudo bem?
Vem aqui comigo, por favor.
O que nós fizemos então?
Estamos indo interpretar aquele
resultado onde estão os comentários,
os dados do antes e do depois,
um primeiro teste
de hipótese que nós fizemos.
E aqui nós vamos imprimir esse
resultado do teste de hipótese,
que é o que acabamos de fazer.
Vou deixar só comentado, mas
vai se fazer a mesma saída, tá?
Então
o que nós temos aqui?
Como que a gente pode interpretar?
Você só mandou imprimir e colocou o título
aqui, que é o resto entregue.
E aí você tem que novamente focar
na análise da saída dos dados.
Tem esse p value aqui,
que é um dos focos da nossa análise.
Se vocês voltarem aqui para o começo,
vocês podem tirar algumas análise
do que a gente está buscando
ou os intervalos de confiança.
Usado para estimar a incerteza associada
a uma estimativa pontual.
O quanto a gente tem a certeza
ou incerteza que isso está nos ajudando.
Então, aqui nós conseguimos fazer
com que a linguagem R
fizesse essa análise do tempo,
o antes e o depois,
olhando antes da execução,
nós conseguimos ter a certeza.
Mas lembre se sempre no dia
a dia do seu trabalho,
na sua vida pessoal,
você vai precisar analisar dados
que geralmente esse conjunto de dados
é muito maior.
Então utilize o R
para que faça essa análise por você.
E agora fica uma dica pense em um cenário,
algo da sua vida pessoal
ou de algum familiar seu,
ou até mesmo da sua empresa que você tem
esse conjunto de dados do antes e o depois
e você precisa fazer essa análise,
de preferência
um conjunto de dados até maior,
e aí você tente executar esse
script novamente,
buscando essa análise nos comentários
e você consiga chegar no seu resultado.
Então você
terá certeza que fazendo na prática
você consegue
absorver esse conhecimento e.