Uma das
maneiras de se aprender
é fazendo na prática.
E agora nós temos um case para trazer aqui
que nós iremos
conseguir executar
a partir de hipóteses e intervalos.
Pense no cenário.
Vocês têm um sistema que o sistema
não está performando
muito bem
e aí é feita uma análise e colete.
São coletados os dados
e de hora em hora, quanto
que está a performance daquele sistema?
Então é estudado e verificado que existe
a possibilidade de se melhorar o algoritmo
e implementar essas melhorias do algoritmo
e posteriormente
são coletados novamente os dados
com relação à performance do sistema.
Então você tem o antes e o depois.
Se você tem o antes e o depois dos dados,
você pode comparar.
Se for um intervalo bem pequeno,
talvez você
consiga no seu papel ali olhando comparar.
Mas imagine uma situação real
em uma empresa que um sistema
fica processando durante 24 horas
durante um mês.
Quanto?
Quanto os dados
você tem ali para fazer essa comparação?
Então vamos fazer isso aqui na prática,
deixar o script pré pronto,
sempre daquela maneira,
deixando essa parte com a hashtag,
que é um resumo teórico do que nós
iremos analisar,
até mesmo algumas explicações
um pouco mais técnica
ou com a parte de estatística.
Então, aqui nós temos duas bases de dados.
Se você apertar um entre,
isso vai ser executado, mas a gente
sempre gosta de fazer na prática.
Vamos apertar Ao entrar aqui,
nós iremos copiar essas duas
bases de dados, porque se traz pronto.
Não precisa criar agora duas.
Dois conjuntos de dados.
Ou vou limpar aqui.
Vamos interpretar o que nós temos
são os dados para análise,
ou pode tirar isso daqui, o sinalzinho.
Então nós temos aqui
antes da implementação do algoritmo.
Vamos supor que nós for
o que foi analisado.
Nós temos aqui um,
ora um, ora dois, ora três,
ora quatro, ora 05h00, 06h07 e hora oito.
Então, antes de implementar essa melhoria
no algoritmo,
esses são os valores
dos tempo de execução.
Vamos supor em segundos.
E aí foi implementado a melhoria.
E aí fez uma nova,
Fizeram uma nova coleta de dados.
E aí, em segundos, quanto tempo demorou?
"Se você olhar aqui, Rafa,
não precisa nem processar.
Já fica visível que sim, está melhor."
Mas lembre-se que, no dia a dia,
você geralmente tem um conjunto
de dados muito maior.
Então, se você for fazer análise no papel,
você vai demorar muitas horas.
E aqui, o mesmo script
que nós vamos executar agora,
serve para um conjunto pequeno de dados
como esse ou para um conjunto muito maior.
Vamos ver como fica.
Então nós vamos apertar Enter aqui
e sempre.
Não é obrigatório, mas é sempre legal
você visualizar os dados
para confirmar que está tudo certinho.
Criamos o tempo antes
e pedimos para mostrar o tempo antes.
Vamos apertar 2 a 3 aqui, gente,
vamos mostrar ele de novo.
Você pode digitar tempos depois
ou você pode utilizar a sugestão dele
para cima ou apertar enter.
Então nós criamos aqui
o antes e o depois.
Legal!
Vamos subir um pouquinho
então, aqui novamente
naquela velha dica
se tem alguma dúvida das análises
que iremos fazer, fica um resumo
aqui para vocês.
Pode pausar e anotar aqui.
São os dois dados, os dois conjuntos
de dados que acabamos de criar.
E agora nós vamos para uma próxima parte.
Deixa eu pegar, Rafa,
tem mais comentário aí do que execução.
Sim, é sempre legal
vocês terem esse resumo.
Eu gosto deixar um resumo para vocês.
Vou dar um repertório entra aqui, tela
fica um pouco limpo,
deixa eu só arrumar aqui
só um minuto que nós temos aqui.
Rafa.
Porque voltando a primeira
que é o título,
realizando o teste de hipóteses.
E aí, aqui nós temos o que nós queremos
analisar, eu vou apertar o entre,
vou imprimir e aí nós vamos interpretando,
iremos interpretar junto.
Tudo bem,
para teste um de lá na hipótese legal.
Que construção que é essa, Rafa, que vocês
escutou e você ainda não ensinou?
Vamos tentar entender o que está aqui.
Vamos tentar? Não vamos entender, né?
Teste anterior Hipótese é um nome
de uma variável, aí sinal de menor assim.
Então o que acontecer aqui
será atribuído para dentro desse
essa variável tender lá teste
e mais um tema que vocês precisam
aprender.
O que seria isso?
Oh, ele é usado.
Ele é mais usado
para comparar a média de dois grupos
e determinar estatisticamente
se há diferença entre eles.
Então nós não temos duas bases de dados.
Oh, vamos lembrar que a base de dados da
análise da performance do sistema do antes
e a análise dos dados com a base de dados
do depois com a performance.
Se você olhar
1A1, se vai ver que está melhor mesmo.
Mas vamos deixar para o R fazer isso
para nós.
Então
nós temos que fornecer a base de dados,
o conjunto de dados do antes e do depois.
E aqui o que a gente faz
é uma instrução para dizer que nós estamos
fazendo uma comparação com essas duas,
com duas bases de dados.
Rafa Poderíamos fazer uma análise
com mais base de dados?
Sim, poderíamos.
Aqui nós só estamos comparando duas.
E aí você fala Nossa, Rafa,
saiu um resultado aí um pouquinho extenso.
Calma aí que nós iremos interpretar ele.
Tudo bem? Vem aqui comigo, por favor.
Então o que nós fizemos?
Estamos indo interpretar aquele resultado
que estão os comentários,
os dados do antes e do depois.
Uma primeira,
primeira,
o teste de hipótese que nós fizemos.
E aqui nós vamos imprimir esse resultado
do teste, hipótese
que é o que a gente acabou de fazer.
Vou deixar só comentado,
mas vai se fazer a mesma saída, tá?
Então
o que nós temos aqui?
Como que a gente pode interpretar?
Você só mandou imprimir e colocou o título
aqui, que é o resto entregue.
E aí você tem que novamente focar
na análise da saída dos dados.
Tem esse p value aqui,
que é um dos focos da nossa análise.
Se vocês voltarem aqui para o começo,
vocês podem tirar algumas análise
do que a gente está buscando
ou os intervalos de confiança.
Usado para estimar a incerteza associada
a uma estimativa pontual.
O quanto a gente tem a certeza
ou incerteza que isso está nos ajudando.
Então, aqui nós conseguimos fazer
com que a linguagem R
fizesse essa análise do tempo,
o antes e o depois,
olhando antes da execução,
nós conseguimos ter a certeza.
Mas lembre se sempre no dia
a dia do seu trabalho,
na sua vida pessoal,
você vai precisar analisar dados
que geralmente esse conjunto de dados
é muito maior.
Então utilize o R
para que faça essa análise por você.
E agora fica uma dica pense em um cenário,
algo da sua vida pessoal
ou de algum familiar seu,
ou até mesmo da sua empresa que você tem
esse conjunto de dados do antes e o depois
e você precisa fazer essa análise,
de preferência
um conjunto de dados até maior,
e aí você tente executar esse
script novamente,
buscando essa análise nos comentários
e você consiga chegar no seu resultado.
Então você
terá certeza que fazendo na prática
você consegue
absorver esse conhecimento e.