Você já teve a necessidade de fazer a sua média salarial, calcular a média das suas notas ou qualquer outro tipo de média? E é isso então que eu vou ensinar hoje para vocês. Mas não pense que será no Excel ou em uma calculadora. Nós iremos fazer isso dentro da Linguagem R. Vem comigo que eu vou mostrar para vocês como fazer isso. Eu já deixei aqui para vocês um script pronto, e aí você fala: "Pô, Rafa, mas o que nós iremos fazer? Só executar? Gente, só executar. Aqui estão os valores e aqui estão os resultados. Com certeza esse não é o meu objetivo com vocês, tá? O script está aqui. Toda vez que você vir essa hashtag, é um comentário que ele está ignorando na execução, e o restante aqui, ou eu estou pedindo para ele fazer algo, uma execução, uma atribuição de um valor, ou mostrar em tela. Então vamos pegar aqui por partes para não precisarmos executar junto com computador, tudo bem? Se pegarmos aqui esse primeiro, " dados de vendas mensais", teremos aqui a variável "vendas". Nós estamos atribuindo oito conjuntos de valores para dentro de vendas aqui. Vamos supor: mês um, mês dois, mês três, mês quatro, mês cinco, mês seis, mês sete, mês oito. Então nós temos aqui as vendas de oito meses. Atribuímos, e aqui nós mostramos. Quando fazemos isso, aparece esses valores. Legal, então nós temos um conjunto de valores de vendas. O que nós podemos fazer agora? Pegar esses oito valores e achar a média. De cabeça, talvez você já consiga imaginar como será, né? O computador vai fazer o quê? Pegar os oito valores, somar todos esses valores, e dividir por oito. Então acharemos a média. Vamos ver como fazer isso com o R? Eu deixei para vocês um script pré-pronto aqui, mas vamos rodar juntos. O que seria isso? Tem uma variável chamada vendas. Nessa variável, nós temos um conjunto de valores. Vamos supor que nós temos oito meses. Precisamos representar então mês um, mês dois, mês três, mês quatro, mês cinco, mês seis, mês sete, mês oito. Então esses são os valores das vendas de oito meses. Se eu apertar o Enter, eu atribuo esses oito valores à variável vendas. E agora eu vou dar a instrução print, o nome da variável vendas, e nós vamos conseguir visualizar os oito valores. Agora nós vamos para o nosso primeiro objetivo: calcular a média desses oito valores. Na sua cabeça, você já deve ter feito... Abriu o seu Excel, a sua calculadora, somou os oito valores e dividiu por oito. Sim, está certo o que você fez, mas vamos aprender a fazer isso com o R? Não é difícil, é bem simples. Vem comigo. O que nós precisamos fazer agora? Nós precisamos criar uma nova variável. Vamos chamá-la de "media_vendas". Inclusive eu estou usando a mesma coisa que está no script aqui, tá, para não precisarmos ficar mudando muito. "Rafa, eu posso dar um nome de outra variável?" Pode. Fique à vontade. Essa é a instrução que calcula a média. E agora? Qual o intervalo de valores? Onde estão? Está dentro de vendas. Então eu estou pedindo para o R pegar todos os valores que estão dentro de vendas e calcular a média através dessa instrução, e atribuir ao valor da média dentro dessa variável. Vamos apertar o Enter, e agora precisamos visualizar o que foi armazenado dentro dessa variável. Vamos ver qual é a média então? Se apertar o Enter... A média então desses oito valores é 162.5. O primeiro objetivo foi alcançado. Vamos evoluir mais um pouco agora? Agora nós vamos aprender a calcular a mediana. Voltando para a tela, eu deixei aqui um comentário, tá? Você pode escutar o que eu vou falar e anotar, ou você também pode olhar os materiais de estudos, ou também está aqui um breve resumo do que é a mediana. Puxando aqui para a parte da estatística que nós estamos mexendo, a mediana é uma medida estatística que representa o valor central em um conjunto de dados. "Qual é o nosso conjunto de dados, Rafa?" Esse conjunto. Vamos continuar trabalhando nele para facilitar, tudo bem? "Rafa, eu tenho um outro conjunto de dados." Aplique. Então é a média central desse conjunto de dados organizado de forma crescente ou decrescente. Nesse caso, não está organizado. "Poxa, Rafa, ele não está." Vamos ver então como fazer isso? O R vai nos ajudar. Se vocês verificarem, nós temos esse script pronto e os comentários. Mas vamos fazer juntos, tudo bem? Então nós vamos fazer o quê? Como anteriormente, nós vamos criar uma variável. Nós vamos chamar "media_vendas", vamos chamar "mediana_vendas", sinal de menor, sinal de atribuição. E o que precisávamos fazer agora? Anteriormente, para calcular a média era assim. Agora nós precisamos calcular a mediana, essa outra instrução. "Rafa, a mediana de qual conjunto de dados?" Olha, vamos selecionar esse conjunto de dados. Está armazenado aonde? Dentro de vendas. Então nós vamos digitar vendas aqui e apertar o Enter. Aí você fala: "Será que funcionou?". Se não deu um erro, à princípio sim. Mas nós precisamos visualizar qual é a variável que armazenou o valor da mediana. Está aqui, Control C + Control V. "Ah, não, Rafa, eu gosto de digitar." Eu tenho uma dica que às vezes é bom você copiar o nome da variável. Mas se você quiser por seu risco digitar. Lembre-se também da facilidade do R, que aparece que tem uma variável com esse nome. Ah, é essa mesmo que eu quero. Eu vou apertar o Enter. O que acabamos de descobrir aqui então? Anteriormente, descobrimos que a média desses oito números era 162.5, e a mediana para esses oito números é 165. Alcançamos o nosso segundo objetivo. O nosso terceiro e último objetivo para agora é calcular o desvio-padrão nesse intervalo desses oito números das vendas. Vamos verificar? Vem comigo na minha tela aqui. Então, como anteriormente, eu deixei aqui um script pré-pronto. Eu recomendo novamente a vocês pausarem esse vídeo depois e olharem esses comentários, tá? Vamos relembrar o que é o desvio-padrão. Ele indica a medida de dispersão de um conjunto de dados em relação à sua média aritmética. "Então, Rafa, como assim um conjunto de dados?". O conjunto de dados é esse que temos das vendas, os oito meses, em relação à sua média métrica. Ele vai analisar e fazer um vínculo entre a média aritmética e esse conjunto de dados, que são esses oito valores. Como faz isso? De novo, é simples. Vamos lá? Eu deixei o script aqui, o resultado está aqui, mas vamos fazer juntos. É legal programarmos junto com vocês aqui, olhe: desavio underline padrão underline vendas. "O que é isso, Rafa?" Eu preciso criar uma variável, como anteriormente, que armazene o valor do desvio-padrão desse conjunto de dados. Essa daqui é a variável. Você pode colocar outro nome. Geralmente deixamos o nome para facilitar a compreensão do que ela está armazenando. "E, Rafa, como é a instrução que calcula o desvio-padrão?" Para calcular o desvio-padrão, a instrução é "sd", abro parênteses... Onde está armazenado o conjunto de dados? O conjunto de dados está armazenado dentro de vendas. Então eu coloco aqui o nome do meu conjunto de dados. E agora precisamos visualizar. Vamos ver qual é o valor do desvio-padrão? Você pode copiar ou colar, ou você digita o começo da variável, e o R fala: "Eu acho que é essa". Aperto o Enter. Então o valor do meu desvio-padrão para esse conjunto de dados, esses oito meses das vendas, é 28.15772. Ótimo, conseguimos alcançar nosso objetivo. Com a linguagem R, aprendemos a calcular a média, mediana e o desvio-padrão. E agora fica aquele desafio de sempre, né? Busque um conjunto de valores de dados, seja da sua vida financeira ou alguma outra informação que você tenha, e também coloque em prática a média, mediana e desvio-padrão.