-
Uma das
-
maneiras de se aprender
é fazendo na prática.
-
E agora nós temos um case para trazer aqui
que nós iremos
-
conseguir executar
a partir de hipóteses e intervalos.
-
Pense no cenário.
-
Vocês têm um sistema que o sistema
não está performando
-
muito bem
e aí é feita uma análise e colete.
-
São coletados os dados
-
e de hora em hora, quanto
que está a performance daquele sistema?
-
Então é estudado e verificado que existe
a possibilidade de se melhorar o algoritmo
-
e implementar essas melhorias do algoritmo
e posteriormente
-
são coletados novamente os dados
com relação à performance do sistema.
-
Então você tem o antes e o depois.
-
Se você tem o antes e o depois dos dados,
você pode comparar.
-
Se for um intervalo bem pequeno,
talvez você
-
consiga no seu papel ali olhando comparar.
-
Mas imagine uma situação real
em uma empresa que um sistema
-
fica processando durante 24 horas
durante um mês.
-
Quanto?
-
Quanto os dados
você tem ali para fazer essa comparação?
-
Então vamos fazer isso aqui na prática,
deixar o script pré pronto,
-
sempre daquela maneira,
deixando essa parte com a hashtag,
-
que é um resumo teórico do que nós
-
iremos analisar,
até mesmo algumas explicações
-
um pouco mais técnica
ou com a parte de estatística.
-
Então, aqui nós temos duas bases de dados.
-
Se você apertar um entre,
-
isso vai ser executado, mas a gente
sempre gosta de fazer na prática.
-
Vamos apertar Ao entrar aqui,
-
nós iremos copiar essas duas
bases de dados, porque se traz pronto.
-
Não precisa criar agora duas.
-
Dois conjuntos de dados.
-
Ou vou limpar aqui.
-
Vamos interpretar o que nós temos
-
são os dados para análise,
ou pode tirar isso daqui, o sinalzinho.
-
Então nós temos aqui
antes da implementação do algoritmo.
-
Vamos supor que nós for
o que foi analisado.
-
Nós temos aqui um,
ora um, ora dois, ora três,
-
ora quatro, ora 05h00, 06h07 e hora oito.
-
Então, antes de implementar essa melhoria
no algoritmo,
-
esses são os valores
dos tempo de execução.
-
Vamos supor em segundos.
-
E aí foi implementado a melhoria.
-
E aí fez uma nova,
Fizeram uma nova coleta de dados.
-
E aí, em segundos, quanto tempo demorou?
-
Se você olhar aqui, Rafa,
não precisa nem processar.
-
Já fica visível que sim, está melhor.
-
Mas lembre se
-
que no dia a dia, geralmente
você tem um conjunto de dados muito maior.
-
Então você, se você for fazer análise
no papel, você vai demorar muitas horas.
-
E aqui o mesmo script
que nós vamos executar agora
-
serve para um conjunto pequeno de dados
como esse ou como um conjunto muito maior.
-
Vamos ver como é que fica.
-
Então nós vamos apertar enter aqui
e sempre.
-
Não é obrigatório, mas é sempre legal
-
você visualizar os dados
para confirmar que está tudo certinho.
-
Criamos o tempo antes
e pedimos para mostrar o tempo antes.
-
Vamos apertar 2 a 3 aqui, gente,
vamos mostrar ele de novo.
-
Você pode digitar tempos depois
-
ou você pode utilizar a sugestão dele
para cima ou apertar enter.
-
Então nós criamos aqui
-
o antes e o depois.
-
Legal!
-
Vamos subir um pouquinho
então, aqui novamente
-
naquela velha dica
se tem alguma dúvida das análises
-
que iremos fazer, fica um resumo
aqui para vocês.
-
Pode pausar e anotar aqui.
-
São os dois dados, os dois conjuntos
de dados que acabamos de criar.
-
E agora nós vamos para uma próxima parte.
-
Deixa eu pegar, Rafa,
tem mais comentário aí do que execução.
-
Sim, é sempre legal
vocês terem esse resumo.
-
Eu gosto deixar um resumo para vocês.
-
Vou dar um repertório entra aqui, tela
fica um pouco limpo,
-
deixa eu só arrumar aqui
só um minuto que nós temos aqui.
-
Rafa.
-
Porque voltando a primeira
-
que é o título,
realizando o teste de hipóteses.
-
E aí, aqui nós temos o que nós queremos
analisar, eu vou apertar o entre,
-
vou imprimir e aí nós vamos interpretando,
iremos interpretar junto.
-
Tudo bem,
para teste um de lá na hipótese legal.
-
Que construção que é essa, Rafa, que vocês
escutou e você ainda não ensinou?
-
Vamos tentar entender o que está aqui.
-
Vamos tentar? Não vamos entender, né?
-
Teste anterior Hipótese é um nome
de uma variável, aí sinal de menor assim.
-
Então o que acontecer aqui
será atribuído para dentro desse
-
essa variável tender lá teste
-
e mais um tema que vocês precisam
aprender.
-
O que seria isso?
-
Oh, ele é usado.
-
Ele é mais usado
para comparar a média de dois grupos
-
e determinar estatisticamente
se há diferença entre eles.
-
Então nós não temos duas bases de dados.
-
Oh, vamos lembrar que a base de dados da
análise da performance do sistema do antes
-
e a análise dos dados com a base de dados
do depois com a performance.
-
Se você olhar
-
1A1, se vai ver que está melhor mesmo.
-
Mas vamos deixar para o R fazer isso
para nós.
-
Então
nós temos que fornecer a base de dados,
-
o conjunto de dados do antes e do depois.
-
E aqui o que a gente faz
é uma instrução para dizer que nós estamos
-
fazendo uma comparação com essas duas,
com duas bases de dados.
-
Rafa Poderíamos fazer uma análise
com mais base de dados?
-
Sim, poderíamos.
-
Aqui nós só estamos comparando duas.
-
E aí você fala Nossa, Rafa,
saiu um resultado aí um pouquinho extenso.
-
Calma aí que nós iremos interpretar ele.
-
Tudo bem? Vem aqui comigo, por favor.
-
Então o que nós fizemos?
-
Estamos indo interpretar aquele resultado
-
que estão os comentários,
os dados do antes e do depois.
-
Uma primeira,
-
primeira,
o teste de hipótese que nós fizemos.
-
E aqui nós vamos imprimir esse resultado
do teste, hipótese
-
que é o que a gente acabou de fazer.
-
Vou deixar só comentado,
mas vai se fazer a mesma saída, tá?
-
Então
-
o que nós temos aqui?
-
Como que a gente pode interpretar?
-
Você só mandou imprimir e colocou o título
aqui, que é o resto entregue.
-
E aí você tem que novamente focar
na análise da saída dos dados.
-
Tem esse p value aqui,
que é um dos focos da nossa análise.
-
Se vocês voltarem aqui para o começo,
-
vocês podem tirar algumas análise
-
do que a gente está buscando
ou os intervalos de confiança.
-
Usado para estimar a incerteza associada
a uma estimativa pontual.
-
O quanto a gente tem a certeza
ou incerteza que isso está nos ajudando.
-
Então, aqui nós conseguimos fazer
com que a linguagem R
-
fizesse essa análise do tempo,
o antes e o depois,
-
olhando antes da execução,
nós conseguimos ter a certeza.
-
Mas lembre se sempre no dia
a dia do seu trabalho,
-
na sua vida pessoal,
você vai precisar analisar dados
-
que geralmente esse conjunto de dados
é muito maior.
-
Então utilize o R
para que faça essa análise por você.
-
E agora fica uma dica pense em um cenário,
algo da sua vida pessoal
-
ou de algum familiar seu,
ou até mesmo da sua empresa que você tem
-
esse conjunto de dados do antes e o depois
e você precisa fazer essa análise,
-
de preferência
um conjunto de dados até maior,
-
e aí você tente executar esse
script novamente,
-
buscando essa análise nos comentários
e você consiga chegar no seu resultado.
-
Então você
terá certeza que fazendo na prática
-
você consegue
absorver esse conhecimento e.