-
Você já teve a necessidade
de fazer a sua média salarial,
-
calcular a média das suas notas
ou qualquer outro tipo de média?
-
E é isso então que eu vou
ensinar hoje para vocês.
-
Mas não pense que será no Excel
ou em uma calculadora.
-
Nós iremos fazer isso
dentro da Linguagem R.
-
Vem comigo que eu vou mostrar
para vocês como fazer isso.
-
Eu já deixei aqui para vocês
um script pronto, e aí você fala:
-
"Pô, Rafa, mas o que nós iremos fazer?
-
Só executar?
-
Gente, só executar.
-
Aqui estão os valores
e aqui estão os resultados.
-
Com certeza esse não é
o meu objetivo com vocês, tá?
-
O script está aqui.
-
Toda vez que você vir essa hashtag,
-
é um comentário que ele
está ignorando na execução,
-
e o restante aqui, ou eu estou
pedindo para ele fazer algo,
-
uma execução, uma atribuição
de um valor, ou mostrar em tela.
-
Então vamos pegar aqui por partes
-
para não precisarmos executar
junto com computador, tudo bem?
-
Se pegarmos aqui esse primeiro,
" dados de vendas mensais",
-
teremos aqui a variável "vendas".
-
Nós estamos atribuindo oito conjuntos
de valores para dentro de vendas aqui.
-
Vamos supor: mês um,
mês dois, mês três, mês quatro,
-
mês cinco, mês seis, mês sete, mês oito.
-
Então nós temos aqui
as vendas de oito meses.
-
Atribuímos, e aqui nós mostramos.
-
Quando fazemos isso,
aparece esses valores.
-
Legal, então nós temos
um conjunto de valores de vendas.
-
O que nós podemos fazer agora?
-
Pegar esses oito valores e achar a média.
-
De cabeça, talvez você já consiga
imaginar como será, né?
-
O computador vai fazer o quê?
-
Pegar os oito valores, somar todos
esses valores, e dividir por oito.
-
Então acharemos a média.
-
Vamos ver como fazer isso com o R?
-
Eu deixei para vocês um script
pré-pronto aqui, mas vamos rodar juntos.
-
O que seria isso?
-
Tem uma variável chamada vendas.
-
Nessa variável, nós temos
um conjunto de valores.
-
Vamos supor que nós temos oito meses.
-
Precisamos representar então mês um,
mês dois, mês três, mês quatro,
-
mês cinco, mês seis, mês sete, mês oito.
-
Então esses são os valores
das vendas de oito meses.
-
Se eu apertar o Enter, eu atribuo
esses oito valores à variável vendas.
-
E agora eu vou dar a instrução print,
-
o nome da variável vendas,
-
e nós vamos conseguir
visualizar os oito valores.
-
Agora nós vamos
para o nosso primeiro objetivo:
-
calcular a média desses oito valores.
-
Na sua cabeça, você já deve ter feito...
-
Abriu o seu Excel, a sua calculadora,
somou os oito valores e dividiu por oito.
-
Sim, está certo o que você fez,
-
mas vamos aprender a fazer isso com o R?
-
Não é difícil, é bem simples. Vem comigo.
-
O que nós precisamos fazer agora?
-
Nós precisamos criar uma nova variável.
-
Vamos chamá-la de "media_vendas".
-
Inclusive eu estou usando a mesma
coisa que está no script aqui, tá,
-
para não precisarmos ficar mudando muito.
-
"Rafa, eu posso dar um nome
de outra variável?"
-
Pode. Fique à vontade.
-
Essa é a instrução que calcula a média.
-
E agora? Qual o intervalo de valores?
-
Onde estão?
-
Está dentro de vendas.
-
Então eu estou pedindo
para o R pegar todos os valores
-
que estão dentro de vendas e calcular
a média através dessa instrução,
-
e atribuir ao valor da média
dentro dessa variável.
-
Vamos apertar o Enter,
e agora precisamos visualizar
-
o que foi armazenado
dentro dessa variável.
-
Vamos ver qual é a média então?
-
Se apertar o Enter...
-
A média então desses oito valores é 162.5.
-
O primeiro objetivo foi alcançado.
-
Vamos evoluir mais um pouco agora?
-
Agora nós vamos aprender
a calcular a mediana.
-
Voltando para a tela, eu
deixei aqui um comentário, tá?
-
Você pode escutar
o que eu vou falar e anotar,
-
ou você também pode
olhar os materiais de estudos,
-
ou também está aqui um breve
resumo do que é a mediana.
-
Puxando aqui para a parte da estatística
que nós estamos mexendo,
-
a mediana é uma medida estatística
-
que representa o valor central
em um conjunto de dados.
-
"Qual é o nosso conjunto de dados, Rafa?"
-
Esse conjunto.
-
Vamos continuar trabalhando nele
para facilitar, tudo bem?
-
"Rafa, eu tenho um outro
conjunto de dados."
-
Aplique.
-
Então é a média central
desse conjunto de dados
-
organizado de forma
crescente ou decrescente.
-
Nesse caso, não está organizado.
-
"Poxa, Rafa, ele não está."
-
Vamos ver então como fazer isso?
-
O R vai nos ajudar.
-
Se vocês verificarem, nós temos
esse script pronto e os comentários.
-
Mas vamos fazer juntos, tudo bem?
-
Então nós vamos fazer o quê?
-
Como anteriormente,
nós vamos criar uma variável.
-
Nós vamos chamar "media_vendas",
vamos chamar "mediana_vendas",
-
sinal de menor, sinal de atribuição.
-
E o que precisávamos fazer agora?
-
Anteriormente, para calcular
a média era assim.
-
Agora nós precisamos calcular
a mediana, essa outra instrução.
-
"Rafa, a mediana de qual
conjunto de dados?"
-
Olha, vamos selecionar
esse conjunto de dados.
-
Está armazenado aonde?
-
Dentro de vendas.
-
Então nós vamos digitar
vendas aqui e apertar o Enter.
-
Aí você fala: "Será que funcionou?".
-
Se não deu um erro, à princípio sim.
-
Mas nós precisamos visualizar
qual é a variável
-
que armazenou o valor da mediana.
-
Está aqui, Control C + Control V.
-
"Ah, não, Rafa, eu gosto de digitar."
-
Eu tenho uma dica que às vezes é
bom você copiar o nome da variável.
-
Mas se você quiser por seu risco digitar.
-
Lembre-se também da facilidade do R,
-
que aparece que tem
uma variável com esse nome.
-
Ah, é essa mesmo que eu quero.
-
Eu vou apertar o Enter.
-
O que acabamos de descobrir aqui então?
-
Anteriormente, descobrimos
que a média desses oito números
-
era 162.5,
-
e a mediana para esses oito números é 165.
-
Alcançamos o nosso segundo objetivo.
-
O nosso terceiro e último objetivo
para agora é calcular o desvio-padrão
-
nesse intervalo desses
oito números das vendas.
-
Vamos verificar?
-
Vem comigo na minha tela aqui.
-
Então, como anteriormente, eu
deixei aqui um script pré-pronto.
-
Eu recomendo novamente a vocês
pausarem esse vídeo depois
-
e olharem esses comentários, tá?
-
Vamos relembrar o que é o desvio-padrão.
-
Ele indica a medida de dispersão
de um conjunto de dados
-
em relação à sua média aritmética.
-
"Então, Rafa, como assim
um conjunto de dados?".
-
O conjunto de dados é esse que temos
das vendas, os oito meses,
-
em relação à sua média métrica.
-
Ele vai analisar e fazer um vínculo
entre a média aritmética
-
e esse conjunto de dados,
que são esses oito valores.
-
Como faz isso?
-
De novo, é simples.
-
Vamos lá?
-
Eu deixei o script aqui, o resultado
está aqui, mas vamos fazer juntos.
-
É legal programarmos
junto com vocês aqui, olhe:
-
desavio underline padrão underline vendas.
-
"O que é isso, Rafa?"
-
Eu preciso criar uma variável,
como anteriormente,
-
que armazene o valor do desvio-padrão
desse conjunto de dados.
-
Essa daqui é a variável.
-
Você pode colocar outro nome.
-
Geralmente deixamos o nome
para facilitar a compreensão
-
do que ela está armazenando.
-
"E, Rafa, como é a instrução
que calcula o desvio-padrão?"
-
Para calcular o desvio-padrão,
a instrução é "sd", abro parênteses...
-
Onde está armazenado o conjunto de dados?
-
O conjunto de dados está
armazenado dentro de vendas.
-
Então eu coloco aqui o nome
do meu conjunto de dados.
-
E agora precisamos visualizar.
-
Vamos ver qual é o valor do desvio-padrão?
-
Você pode copiar ou colar, ou você
digita o começo da variável, e o R fala:
-
"Eu acho que é essa".
-
Aperto o Enter.
-
Então o valor do meu desvio-padrão
para esse conjunto de dados,
-
esses oito meses das vendas, é 28.15772.
-
Ótimo, conseguimos
alcançar nosso objetivo.
-
Com a linguagem R, aprendemos a calcular
a média, mediana e o desvio-padrão.
-
E agora fica aquele desafio de sempre, né?
-
Busque um conjunto de valores de dados,
-
seja da sua vida financeira ou alguma
outra informação que você tenha,
-
e também coloque em prática
a média, mediana e desvio-padrão.