-
Você já teve a necessidade
de fazer a sua média salarial,
-
calcular a média das suas notas
ou qualquer outro tipo de média?
-
E é isso então que eu vou
ensinar hoje para vocês.
-
Mas não pense que será no Excel
ou em uma calculadora.
-
Nós iremos fazer isso
dentro da linguagem R.
-
Vem comigo que eu vou mostrar
para vocês como fazer isso.
-
Eu já deixei aqui para vocês um script
pronto, e aí você fala:
-
"Pô, Rafa, mas o que nós iremos fazer?
-
Só executar?
-
Gente, só executar.
-
Aqui estão os valores
e aqui estão os resultados.
-
Com certeza esse não é
o meu objetivo com vocês, tá?
-
O script está aqui.
-
Toda vez que você vir essa hashtag,
-
é um comentário que ele
está ignorando na execução
-
e o restante aqui, ou eu estou
pedindo para ele fazer algo,
-
uma execução, uma atribuição
de um valor, ou mostrar em tela.
-
Então vamos pegar aqui por partes
-
para não precisarmos executar
junto com computador, tudo bem?
-
Se pegarmos aqui esses
primeiros dados de vendas mensais,
-
teremos aqui a variável vendas.
-
Nós estamos atribuindo oito conjuntos
de valores para dentro de vendas aqui.
-
Vamos supor: mês um,
mês dois, mês três, mês quatro,
-
mês cinco, mês seis, mês sete, mês oito.
-
Então nós temos aqui
as vendas de oito meses.
-
Atribuímos.
-
E aqui nós mostramos.
-
Quando fazemos isso,
aparece esses valores.
-
Legal, então nós temos
um conjunto de valores de vendas aí.
-
O que nós podemos fazer agora?
-
Pegar esses oito valores e achar a média.
-
De cabeça, talvez você já consiga
imaginar como será, né? o computador.
-
O computador vai fazer o quê?
-
Pegar os oito valores, somar
todos esses valores, e dividir por oito.
-
Então acharemos a média.
-
Vamos ver como fazer isso com o R?
-
Eu deixei para vocês um script
pré-pronto aqui, mas vamos rodar juntos.
-
O que seria isso?
-
Tem uma variável chamada vendas.
-
Nessa variável, nós temos
um conjunto de valores.
-
Vamos supor que nós temos oito meses.
-
Precisamos representar então mês um,
mês dois, mês três, mês quatro,
-
mês cinco, mês seis, mês sete, mês oito.
-
Então esses são os valores
das vendas de oito meses.
-
Se eu apertar o Enter, eu atribuo
esses oito valores à variável vendas.
-
E agora eu vou apertar,
dar a instrução print,
-
o nome da variável vendas,
-
e nós vamos conseguir
visualizar os oito valores.
-
Agora nós vamos
para o nosso primeiro objetivo
-
calcular a média desses
oito valores.
-
Na sua cabeça, você já deve ter feito...
-
Abriu o seu Excel, a sua calculadora,
somou os oito valores e dividiu por oito.
-
Sim, está certo o que você fez,
-
mas vamos aprender a fazer isso com R?
-
Não é difícil, é bem simples. Vem comigo.
-
O que nós precisamos fazer agora?
-
Nós precisamos criar uma nova variável.
-
Vamos chamá-la de "media_vendas", ok?
-
Inclusive eu estou usando a mesma
coisa que está no script aqui, tá,
-
para não precisarmos ficar mudando muito.
-
"Rafa, eu posso dar um nome de outra variável?"
-
Pode. Fique à vontade.
-
Essa é instrução que calcula a média.
-
E agora? Qual o intervalo de valores?
-
Onde estão?
-
Estão dentro de vendas.
-
Então eu estou pedindo
para o R pegar todos os valores
-
que estão dentro de vendas e calcular
média através dessa instrução,
-
e atribuir ao valor da média
dentro dessa variável.
-
Vamos apertar o Enter,
e agora precisamos visualizar
-
o que foi armazenado
dentro dessa variável.
-
Vamos ver qual é a média então?
-
Se apertar o Enter...
-
A média então desses oito valores é 16.,5.
-
O primeiro objetivo foi alcançado.
-
Vamos evoluir mais um pouco agora?
-
Agora nós vamos aprender
a calcular a mediana.
-
Voltando para a tela, eu
deixei aqui um comentário, tá?
-
Você pode escutar
o que eu vou falar e anotar,
-
ou você também pode
olhar os materiais de estudos,
-
ou também está aqui um breve
resumo do que é a mediana.
-
Puxando aqui para a parte da estatística,
nós estamos mexendo.
-
É uma medida estatística que representa
o valor central em um conjunto de dados.
-
Qual é o conjunto de dados?
-
"Nossa, Rafa, é esse conjunto."
-
Vamos continuar
trabalhando neles para facilitar, tudo bem?
-
"Rafa, tem um outro conjunto de dados."
-
Aplique então.
-
e a média central desse
conjunto de dados organizados
-
de forma crescente ou decrescente?
-
Nesse caso, não está organizado.
-
"Poxa, Rafa, ele não está."
-
Vamos ver como fazemos isso.
-
A web vai nos ajudar.
-
Se vocês verificarem, nós temos
esse script pronto e os comentários.
-
Mas vamos fazer juntos, tudo bem?
-
Então nós vamos fazer o quê?
-
Como anteriormente,
nós vamos criar uma variável,
-
nós vamos chamar média vendas,
vamos chamar a mediana:
-
vendas, sinal de menor, sinal de atribuição.
-
E o que precisávamos fazer anteriormente
para calcular a média era assim.
-
agora a média.
-
Agora nós precisamos calcular
a mediana, essa outra instrução.
-
Rafa, de qual conjunto de dados
nós vamos selecionar a mediana?
-
Aonde esse conjunto
de dados está armazenado?
-
Dentro de vendas.
-
Então nós vamos digitar aqui
vendas e apertar o Enter.
-
Aí você fala: "Será que funcionou?".
-
Se não, deu um erro.
-
A princípio sim, mas nós
precisamos visualizar
-
qual é a variável que armazena
o valor da mediana.
-
Está aqui, Control C + Control V.
-
"Ah, não, Rafa, eu gosto de digitar."
-
Eu tenho uma dica que às vezes é
bom você copiar o nome da variável.
-
Mas se você quiser,
é um risco seu digitar.
-
Lembre-se também da facilidade do R.
-
Me parece que tem
uma variável com esse nome.
-
Essa mesmo que eu quero,
-
Eu vou apertar o Enter.
-
O que acabamos de descobrir aqui então?
-
A média.
-
Anteriormente, descobrimos
que a média desses oito números
-
era 107, tem 62,5.
-
É a mediana para esses oito números,
é um meio cinco.
-
Alcançamos o nosso segundo objetivo.
-
Nosso terceiro e último objetivo para
agora é calcular o desvio padrão
-
nesse intervalo desses
oito números das vendas.
-
Vamos verificar. Vem
comigo na minha tela aqui.
-
Então, como anteriormente, eu
deixei aqui um script pré-pronto.
-
Eu recomendo novamente a vocês
pausarem esse vídeo depois
-
e olharem esses comentários.
-
Vamos relembrar o que é o desvio padrão.
-
Ele indica a medida de dispersão
de um conjunto de dados
-
em relação à sua média aritmética.
-
"Então, Rafa, como assim
um conjunto de dados?".
-
O conjunto de dados?
-
É isso que temos nas vendas dos oito
meses em relação à sua média métrica.
-
Ele vai analisar e fazer um vínculo entre
a média aritmética e esse conjunto de dados,
-
que são esses outros valores.
-
Como faz isso de novo?
-
É simples. Vamos lá!
-
Eu deixei o script aqui, o resultado
está aqui, mas vamos fazer juntos.
-
É legal programarmos junto
com vocês aqui o desvio.
-
underline padrão, padrão, underline, vendas.
-
"O que é isso, Rafa?"
-
Eu preciso criar uma variável,
como anteriormente,
-
que armazene o valor do desvio
padrão desse conjunto de dados.
-
Esse daqui, essa daqui.
-
Você pode colocar outro
nome na variável, tudo bem?
-
Geralmente deixamos o nome
para facilitar a compreensão.
-
O que ela está armazenando
é Rafa, como a instrução
-
que calcula o desvio padrão
para calcular o desvio padrão, a instrução
-
SD abre parênteses Qual que é o conjunto
onde está armazenado o conjunto de dados?
-
O conjunto de dados está
armazenado dentro de vendas.
-
Então eu coloco aqui o nome
do meu conjunto de dados.
-
E agora, gente, é só visualizar.
-
Vamos ver qual é o valor do desvio padrão.
-
Você pode copiar/colar, ou você
digitar o começo da variável, o R fala
-
Eu acho que é isso mesmo.
-
Apertei Enter.
-
Então o valor do meu desvio padrão
para esse conjunto de dados,
-
esses oito meses das vendas, é 28,15772.
-
Ótimo!
-
Conseguimos alcançar nosso objetivo,
aprendemos com a linguagem R
-
a calcular a média mediana
e o desvio padrão.
-
E agora fica aquele desafio de sempre
buscar um conjunto de valores de dados,
-
seja da sua vida financeira ou alguma
outra informação que você tenha.
-
E também coloque em prática
a média mediana e desvio padrão.