Você já teve a necessidade
de fazer a sua média salarial,
calcular a média das suas notas
ou qualquer outro tipo de média?
E é isso então que eu vou
ensinar hoje para vocês.
Mas não pense que será no Excel
ou em uma calculadora.
Nós iremos fazer isso
dentro da Linguagem R.
Vem comigo que eu vou mostrar
para vocês como fazer isso.
Eu já deixei aqui para vocês
um script pronto, e aí você fala:
"Pô, Rafa, mas o que nós iremos fazer?
Só executar?
Gente, só executar.
Aqui estão os valores
e aqui estão os resultados.
Com certeza esse não é
o meu objetivo com vocês, tá?
O script está aqui.
Toda vez que você vir essa hashtag,
é um comentário que ele
está ignorando na execução,
e o restante aqui, ou eu estou
pedindo para ele fazer algo,
uma execução, uma atribuição
de um valor, ou mostrar em tela.
Então vamos pegar aqui por partes
para não precisarmos executar
junto com computador, tudo bem?
Se pegarmos aqui esse primeiro,
" dados de vendas mensais",
teremos aqui a variável "vendas".
Nós estamos atribuindo oito conjuntos
de valores para dentro de vendas aqui.
Vamos supor: mês um,
mês dois, mês três, mês quatro,
mês cinco, mês seis, mês sete, mês oito.
Então nós temos aqui
as vendas de oito meses.
Atribuímos, e aqui nós mostramos.
Quando fazemos isso,
aparece esses valores.
Legal, então nós temos
um conjunto de valores de vendas.
O que nós podemos fazer agora?
Pegar esses oito valores e achar a média.
De cabeça, talvez você já consiga
imaginar como será, né?
O computador vai fazer o quê?
Pegar os oito valores, somar todos
esses valores, e dividir por oito.
Então acharemos a média.
Vamos ver como fazer isso com o R?
Eu deixei para vocês um script
pré-pronto aqui, mas vamos rodar juntos.
O que seria isso?
Tem uma variável chamada vendas.
Nessa variável, nós temos
um conjunto de valores.
Vamos supor que nós temos oito meses.
Precisamos representar então mês um,
mês dois, mês três, mês quatro,
mês cinco, mês seis, mês sete, mês oito.
Então esses são os valores
das vendas de oito meses.
Se eu apertar o Enter, eu atribuo
esses oito valores à variável vendas.
E agora eu vou dar a instrução print,
o nome da variável vendas,
e nós vamos conseguir
visualizar os oito valores.
Agora nós vamos
para o nosso primeiro objetivo
calcular a média desses
oito valores.
Na sua cabeça, você já deve ter feito...
Abriu o seu Excel, a sua calculadora,
somou os oito valores e dividiu por oito.
Sim, está certo o que você fez,
mas vamos aprender a fazer isso com R?
Não é difícil, é bem simples. Vem comigo.
O que nós precisamos fazer agora?
Nós precisamos criar uma nova variável.
Vamos chamá-la de "media_vendas", ok?
Inclusive eu estou usando a mesma
coisa que está no script aqui, tá,
para não precisarmos ficar mudando muito.
"Rafa, eu posso dar um nome
de outra variável?"
Pode. Fique à vontade.
Essa é instrução que calcula a média.
E agora? Qual o intervalo de valores?
Onde estão?
Estão dentro de vendas.
Então eu estou pedindo
para o R pegar todos os valores
que estão dentro de vendas e calcular
média através dessa instrução,
e atribuir ao valor da média
dentro dessa variável.
Vamos apertar o Enter,
e agora precisamos visualizar
o que foi armazenado
dentro dessa variável.
Vamos ver qual é a média então?
Se apertar o Enter...
A média então desses oito valores é 16.,5.
O primeiro objetivo foi alcançado.
Vamos evoluir mais um pouco agora?
Agora nós vamos aprender
a calcular a mediana.
Voltando para a tela, eu
deixei aqui um comentário, tá?
Você pode escutar
o que eu vou falar e anotar,
ou você também pode
olhar os materiais de estudos,
ou também está aqui um breve
resumo do que é a mediana.
Puxando aqui para a parte da estatística
que nós estamos mexendo,
a mediana é uma medida estatística
que representa o valor central
em um conjunto de dados.
Qual é o nosso conjunto de dados, Rafa?"
Esse conjunto.
Vamos continuar trabalhando nele
para facilitar, tudo bem?
"Rafa, eu tenho um outro
conjunto de dados."
Aplique.
Então é a média central
desse conjunto de dados
organizado de forma
crescente ou decrescente.
Nesse caso, não está organizado.
"Poxa, Rafa, ele não está."
Vamos ver então como fazer isso?
O R vai nos ajudar.
Se vocês verificarem, nós temos
esse script pronto e os comentários.
Mas vamos fazer juntos, tudo bem?
Então nós vamos fazer o quê?
Como anteriormente,
nós vamos criar uma variável.
Nós vamos chamar media_vendas,
vamos chamar "mediana_vendas",
sinal de menor, sinal de atribuição.
E o que precisávamos fazer agora?
Anteriormente, para calcular
a média era assim.
Agora nós precisamos calcular
a mediana, essa outra instrução.
"Rafa, a mediana de qual
conjunto de dados?"
Olha, vamos selecionar
esse conjunto de dados.
Está armazenado aonde?
Dentro de vendas.
Então nós vamos digitar aqui
vendas e apertar o Enter.
Aí você fala: "Será que funcionou?".
Se não, deu um erro, à princípio sim,
mas nós precisamos visualizar
qual é a variável que armazenou
o valor da mediana.
Está aqui, Control C + Control V.
"Ah, não, Rafa, eu gosto de digitar."
Eu tenho uma dica que às vezes é
bom você copiar o nome da variável.
Mas se você quiser por seu risco digitar.
Lembre-se também da facilidade do R,
que parece que tem
uma variável com esse nome.
Ah, é essa mesmo que eu quero.
Eu vou apertar o Enter.
O que acabamos de descobrir aqui então?
Anteriormente, descobrimos
que a média desses oito números
era 162.5,
e a mediana para esses oito números é 165.
Alcançamos o nosso segundo objetivo.
O nosso terceiro e último objetivo
para agora é calcular o desvio-padrão
nesse intervalo desses
oito números das vendas.
Vamos verificar?
Vem comigo na minha tela aqui.
Então, como anteriormente, eu
deixei aqui um script pré-pronto.
Eu recomendo novamente a vocês
pausarem esse vídeo depois
e olharem esses comentários, tá?
Vamos relembrar o que é o desvio-padrão.
Ele indica a medida de dispersão
de um conjunto de dados
em relação à sua média aritmética.
"Então, Rafa, como assim
um conjunto de dados?".
O conjunto de dados é esse que temos
as vendas dos oito meses
em relação à sua média métrica.
Ele vai analisar e fazer um vínculo
entre a média aritmética
e esse conjunto de dados,
que são esses oito valores.
Como faz isso?
De novo, é simples.
Vamos lá?
Eu deixei o script aqui, o resultado
está aqui, mas vamos fazer juntos.
É legal programarmos
junto com vocês aqui, olhe:
desavio underline padrão underline vendas.
"O que é isso, Rafa?"
Eu preciso criar uma variável,
como anteriormente,
que armazene o valor do desvio-padrão
desse conjunto de dados.
Essa daqui é a variável.
Você pode colocar outro nome.
Geralmente deixamos o nome
para facilitar a compreensão
do que ela está armazenando.
"E, Rafa, como é a instrução
que calcula o desvio-padrão?"
Para calcular o desvio-padrão,
a instrução é "sd", abro parênteses...
Onde está armazenado o conjunto de dados?
O conjunto de dados está
armazenado dentro de vendas.
Então eu coloco aqui o nome
do meu conjunto de dados.
E agora precisamos visualizar.
Vamos ver qual é o valor do desvio-padrão?
Você pode copiar ou colar, ou você
digita o começo da variável, e o R fala:
"Eu acho que é essa".
Aperto o Enter.
Então o valor do meu desvio-padrão
para esse conjunto de dados,
esses oito meses das vendas, é 28.15772.
Ótimo, conseguimos
alcançar nosso objetivo.
Com a linguagem R, aprendemos a calcular
a média, mediana e o desvio-padrão.
E agora fica aquele desafio de sempre, né?
Busque um conjunto de valores de dados,
seja da sua vida financeira ou alguma
outra informação que você tenha,
e também coloque em prática
a média, mediana e desvio-padrão.