Uma das maneiras
de se aprender é praticando.
E agora nós temos um case para trazer aqui
onde nós iremos conseguir executar
a partir de hipóteses e intervalos.
Pense no cenário:
vocês têm um sistema que
não está performando muito bem,
e aí é feita uma análise, são
coletados os dados de hora em hora
para saber como está
a performance daquele sistema.
Então é estudado e verificado que existe
a possibilidade de se melhorar o algoritmo,
implementar essas melhorias
do algoritmo, e, posteriormente,
são coletados novamente os dados
com relação à performance do sistema.
Então você tem o antes e o depois.
Se você tem o antes e o depois
dos dados, você pode comparar.
Se for um intervalo bem pequeno,
talvez você consiga comparar olhando.
Mas imagine uma situação
real em uma empresa
onde um sistema fica processando
durante 24 horas durante um mês.
Quantos dados você tem ali
para fazer essa comparação?
Então vamos fazer isso aqui na prática,
deixar o script pré-pronto,
sempre daquela maneira,
deixando essa parte com a hashtag,
que é um resumo teórico
do que nós iremos analisar,
até mesmo algumas explicações um pouco
mais técnicas, ou com a parte de estatística.
Então, aqui nós temos duas bases de dados.
Se você apertar um Enter,
isso vai ser executado.
Mas sempre gostamos de fazer na prática.
Vamos apertar Ao entrar aqui,
iremos copiar essas duas
bases de dados, porque se traz pronto.
Não precisa criar agora
dois conjuntos de dados.
Eu vou limpar aqui.
Vamos interpretar o que nós temos
são os dados para análise,
ou pode tirar isso daqui, o sinalzinho.
Então nós temos aqui
antes da implementação do algoritmo.
Vamos supor que nós for
o que foi analisado.
Nós temos aqui hora um,
hora um, hora dois, hora três,
hora quatro, hora cinco,
hora seis, hora sete, e hora oito.
Então, antes de implementar
essa melhoria no algoritmo,
esses são os valores
dos tempo de execução.
Vamos supor que em segundos.
E aí foi implementada a melhoria.
E aí fizeram uma nova coleta de dados.
Em segundos, quanto tempo demorou?
"Se você olhar aqui, Rafa,
não precisa nem processar.
Já fica visível que sim, está melhor."
Mas lembre-se que, no dia a dia,
você geralmente tem um conjunto
de dados muito maior.
Então, se você for fazer análise no papel,
você vai demorar muitas horas.
E aqui, o mesmo script
que nós vamos executar agora,
serve para um conjunto pequeno de dados
como esse ou para um conjunto muito maior.
Vamos ver como fica.
Então nós vamos apertar
Enter aqui, como sempre.
Não é obrigatório, mas é sempre
legal você visualizar os dados
para confirmar que está tudo certinho.
Criamos o tempo antes e pedimos
para mostrar o tempo antes.
Vamos apertar 2 a 3 aqui, gente,
vamos mostrá-lo de novo.
Você pode digitar tempos_depois
ou você pode utilizar a sugestão dele
para cima, ou apertar Enter.
Então nós criamos aqui o antes e o depois.
Legal!
Vamos subir um pouquinho
então novamente aqui.
Aquela velha dica: se tem alguma
dúvida das análises que iremos fazer,
fica um resumo aqui para vocês.
Pode pausar e anotar aqui.
São os dois dados, os dois conjuntos
de dados, que acabamos de criar.
E agora nós vamos para uma próxima parte.
"Deixe-me pegar, Rafa.
Tem mais comentário aí do que execução.
Sim, é sempre legal
vocês terem esse resumo.
Eu gosto de deixar um resumo para vocês.
Eu vou dar um Enter aqui
para a tela ficar um pouco limpa.
Deixe-me só arrumar aqui
só um minuto que nós temos aqui.
Rafa.
Porque voltando a primeira, que é o título,
realizando o teste de hipóteses.
E aí, aqui nós temos
o que nós queremos analisar.
Eu vou apertar o Enter, vou imprimir,
e aí nós vamos interpretar juntos, tudo bem?
Para teste um de lá na hipótese legal.
Que construção é essa, Rafa, que vocês
escutou e você ainda não ensinou?
Vamos tentar entender o que está aqui.
Vamos tentar? Não vamos entender, né?
Teste anterior Hipótese é um nome
de uma variável, aí sinal de menor assim.
Então o que acontecer aqui
será atribuído para dentro desse
essa variável tender lá teste.
É mais um tema que vocês
precisam aprender.
O que seria isso?
Oh, ele é usado.
Ele é mais usado para comparar
a média de dois grupos
e determinar estatisticamente
se há diferença entre eles.
Então nós não temos duas bases de dados.
Vamos lembrar que é a base de dados
da análise da performance do sistema do antes
e a análise dos dados com a base de dados
do depois com a performance.
Se você olhar um a um, você
vai ver que está melhor mesmo.
Mas vamos deixar o R fazer isso para nós.
Então nós temos que fornecer
a base de dados,
o conjunto de dados do antes e do depois.
E aqui nós fazemos uma instrução
para dizer que nós estamos fazendo
uma comparação com duas bases de dados.
"Rafa, poderíamos fazer uma análise
com mais base de dados?"
Sim, poderíamos.
Aqui nós só estamos comparando duas.
E aí você fala: "Nossa, Rafa, saiu
um resultado um pouquinho extenso."
Calma aí que nós iremos
interpretá-lo, tudo bem?
Vem aqui comigo, por favor.
O que nós fizemos então?
Estamos indo interpretar aquele
resultado onde estão os comentários,
os dados do antes e do depois,
um primeiro teste
de hipótese que nós fizemos.
E aqui nós vamos imprimir esse
resultado do teste de hipótese,
que é o que acabamos de fazer.
Vou deixar só comentado, mas
vai se fazer a mesma saída, tá?
O que nós temos aqui então?
Como podemos interpretar?
"Você só mandou imprimir e colocou
o título aqui, que é o resto entregue."
E aí você tem que novamente focar
na análise da saída dos dados.
Tem esse p-value aqui, que é
um dos focos da nossa análise.
Se vocês voltarem para o começo aqui,
vocês podem tirar algumas análises
do que estamos buscando,
os intervalos de confiança,
usados para estimar a incerteza
associada à uma estimativa pontual.
O quanto temos a certeza,
ou incerteza, que isso está nos ajudando.
Então nós conseguimos fazer
com que a linguagem R
fizesse essa análise do tempo,
o antes e o depois.
Olhando antes da execução,
nós conseguimos ter a certeza.
Mas lembre-se sempre
no dia a dia do seu trabalho,
na sua vida pessoal, que você
vai precisar analisar dados
onde geralmente esse conjunto
de dados é muito maior.
Então utilize o R para que faça
essa análise por você.
E agora fica uma dica:
pense em um cenário,
algo da sua vida pessoal ou de algum
familiar seu, ou até mesmo da sua empresa,
que você tem esse conjunto
de dados do antes e o depois,
e você precisa fazer essa análise,
de preferência
um conjunto de dados até maior,
e aí tente executar esse script novamente,
buscando essa análise nos comentários,
e tente chegar no seu resultado.
Então você terá certeza que, na prática,
você consegue absorver
esse conhecimento.