0:00:07.900,0:00:11.578 Você já teve a necessidade [br]de fazer a sua média salarial, 0:00:11.578,0:00:15.915 calcular a média das suas notas[br]ou qualquer outro tipo de média? 0:00:15.915,0:00:18.518 E é isso então que eu vou [br]ensinar hoje para vocês. 0:00:18.518,0:00:21.688 Mas não pense que será no Excel[br]ou em uma calculadora. 0:00:21.688,0:00:24.891 Nós iremos fazer isso [br]dentro da Linguagem R. 0:00:24.891,0:00:27.300 Vem comigo que eu vou mostrar [br]para vocês como fazer isso. 0:00:27.300,0:00:31.041 Eu já deixei aqui para vocês [br]um script pronto, e aí você fala: 0:00:31.041,0:00:33.233 "Pô, Rafa, mas o que nós iremos fazer? 0:00:33.233,0:00:34.412 Só executar? 0:00:34.412,0:00:35.702 Gente, só executar. 0:00:35.702,0:00:38.371 Aqui estão os valores[br]e aqui estão os resultados. 0:00:38.371,0:00:41.474 Com certeza esse não é [br]o meu objetivo com vocês, tá? 0:00:41.474,0:00:42.342 O script está aqui. 0:00:42.342,0:00:44.469 Toda vez que você vir essa hashtag, 0:00:44.469,0:00:47.889 é um comentário que ele [br]está ignorando na execução, 0:00:47.889,0:00:50.917 e o restante aqui, ou eu estou [br]pedindo para ele fazer algo, 0:00:50.917,0:00:54.187 uma execução, uma atribuição [br]de um valor, ou mostrar em tela. 0:00:54.187,0:00:55.671 Então vamos pegar aqui por partes 0:00:55.671,0:00:59.618 para não precisarmos executar [br]junto com computador, tudo bem? 0:00:59.618,0:01:03.056 Se pegarmos aqui esse primeiro,[br]" dados de vendas mensais", 0:01:03.056,0:01:06.232 teremos aqui a variável "vendas". 0:01:06.232,0:01:11.704 Nós estamos atribuindo oito conjuntos [br]de valores para dentro de vendas aqui. 0:01:11.704,0:01:15.949 Vamos supor: mês um, [br]mês dois, mês três, mês quatro, 0:01:15.949,0:01:19.312 mês cinco, mês seis, mês sete, mês oito. 0:01:19.312,0:01:22.248 Então nós temos aqui [br]as vendas de oito meses. 0:01:22.248,0:01:24.584 Atribuímos, e aqui nós mostramos. 0:01:24.584,0:01:28.288 Quando fazemos isso,[br]aparece esses valores. 0:01:28.288,0:01:31.741 Legal, então nós temos [br]um conjunto de valores de vendas. 0:01:31.741,0:01:33.526 O que nós podemos fazer agora? 0:01:33.526,0:01:36.929 Pegar esses oito valores e achar a média. 0:01:36.929,0:01:40.360 De cabeça, talvez você já consiga [br]imaginar como será, né? 0:01:40.360,0:01:41.634 O computador vai fazer o quê? 0:01:41.634,0:01:45.805 Pegar os oito valores, somar todos [br]esses valores, e dividir por oito. 0:01:45.805,0:01:47.306 Então acharemos a média. 0:01:47.306,0:01:49.193 Vamos ver como fazer isso com o R? 0:01:49.193,0:01:55.081 Eu deixei para vocês um script [br]pré-pronto aqui, mas vamos rodar juntos. 0:01:55.081,0:01:56.015 O que seria isso? 0:01:56.015,0:01:58.184 Tem uma variável chamada vendas. 0:01:58.184,0:02:01.954 Nessa variável, nós temos [br]um conjunto de valores. 0:02:01.954,0:02:04.490 Vamos supor que nós temos oito meses. 0:02:04.490,0:02:08.828 Precisamos representar então mês um, [br]mês dois, mês três, mês quatro, 0:02:08.828,0:02:12.899 mês cinco, mês seis, mês sete, mês oito. 0:02:12.899,0:02:16.035 Então esses são os valores [br]das vendas de oito meses. 0:02:16.035,0:02:20.651 Se eu apertar o Enter, eu atribuo[br]esses oito valores à variável vendas. 0:02:20.651,0:02:25.050 E agora eu vou dar a instrução print, 0:02:25.050,0:02:27.280 o nome da variável vendas, 0:02:27.280,0:02:29.853 e nós vamos conseguir [br]visualizar os oito valores. 0:02:30.460,0:02:33.519 Agora nós vamos [br]para o nosso primeiro objetivo: 0:02:33.519,0:02:36.109 calcular a média desses oito valores. 0:02:36.109,0:02:39.358 Na sua cabeça, você já deve ter feito... 0:02:39.358,0:02:44.130 Abriu o seu Excel, a sua calculadora,[br]somou os oito valores e dividiu por oito. 0:02:44.130,0:02:45.594 Sim, está certo o que você fez, 0:02:45.594,0:02:47.934 mas vamos aprender a fazer isso com o R? 0:02:47.934,0:02:50.340 Não é difícil, é bem simples. Vem comigo. 0:02:50.340,0:02:53.139 O que nós precisamos fazer agora? 0:02:53.139,0:02:55.942 Nós precisamos criar uma nova variável. 0:02:55.942,0:02:59.812 Vamos chamá-la de "media_vendas". 0:02:59.812,0:03:03.112 Inclusive eu estou usando a mesma [br]coisa que está no script aqui, tá, 0:03:03.112,0:03:04.474 para não precisarmos ficar mudando muito. 0:03:04.474,0:03:06.935 "Rafa, eu posso dar um nome [br]de outra variável?" 0:03:06.935,0:03:09.155 Pode. Fique à vontade. 0:03:09.155,0:03:12.224 Essa é a instrução que calcula a média. 0:03:12.224,0:03:14.156 E agora? Qual o intervalo de valores?[br] 0:03:14.156,0:03:15.036 Onde estão? 0:03:15.036,0:03:16.596 Está dentro de vendas. 0:03:16.596,0:03:20.199 Então eu estou pedindo [br]para o R pegar todos os valores 0:03:20.199,0:03:25.638 que estão dentro de vendas e calcular [br]a média através dessa instrução, 0:03:25.638,0:03:29.141 e atribuir ao valor da média[br]dentro dessa variável. 0:03:29.141,0:03:32.578 Vamos apertar o Enter,[br]e agora precisamos visualizar 0:03:32.578,0:03:35.648 o que foi armazenado[br]dentro dessa variável. 0:03:35.648,0:03:37.484 Vamos ver qual é a média então? 0:03:37.484,0:03:38.884 Se apertar o Enter... 0:03:38.884,0:03:44.957 A média então desses oito valores é 162.5. 0:03:44.957,0:03:46.599 O primeiro objetivo foi alcançado. 0:03:46.599,0:03:49.395 Vamos evoluir mais um pouco agora? 0:03:49.395,0:03:53.909 Agora nós vamos aprender [br]a calcular a mediana. 0:03:53.909,0:03:58.237 Voltando para a tela, eu [br]deixei aqui um comentário, tá? 0:03:58.237,0:04:01.407 Você pode escutar [br]o que eu vou falar e anotar, 0:04:01.407,0:04:04.176 ou você também pode [br]olhar os materiais de estudos, 0:04:04.176,0:04:07.670 ou também está aqui um breve [br]resumo do que é a mediana. 0:04:07.670,0:04:11.617 Puxando aqui para a parte da estatística[br]que nós estamos mexendo, 0:04:11.617,0:04:13.707 a mediana é uma medida estatística 0:04:13.707,0:04:17.289 que representa o valor central [br]em um conjunto de dados. 0:04:17.289,0:04:19.417 "Qual é o nosso conjunto de dados, Rafa?" 0:04:19.417,0:04:20.292 Esse conjunto. 0:04:20.292,0:04:23.145 Vamos continuar trabalhando nele [br]para facilitar, tudo bem? 0:04:23.145,0:04:24.930 "Rafa, eu tenho um outro [br]conjunto de dados." 0:04:24.930,0:04:25.799 Aplique. 0:04:25.799,0:04:30.393 Então é a média central [br]desse conjunto de dados 0:04:30.393,0:04:34.073 organizado de forma [br]crescente ou decrescente. 0:04:34.073,0:04:37.510 Nesse caso, não está organizado. 0:04:37.510,0:04:38.844 "Poxa, Rafa, ele não está." 0:04:38.844,0:04:41.080 Vamos ver então como fazer isso? 0:04:41.080,0:04:42.615 O R vai nos ajudar. 0:04:42.615,0:04:46.867 Se vocês verificarem, nós temos [br]esse script pronto e os comentários. 0:04:46.867,0:04:48.988 Mas vamos fazer juntos, tudo bem? 0:04:48.988,0:04:50.155 Então nós vamos fazer o quê? 0:04:50.155,0:04:52.658 Como anteriormente,[br]nós vamos criar uma variável. 0:04:52.658,0:04:57.618 Nós vamos chamar "media_vendas",[br]vamos chamar "mediana_vendas", 0:04:57.618,0:05:00.766 sinal de menor, sinal de atribuição. 0:05:00.766,0:05:02.889 E o que precisávamos fazer agora? 0:05:02.889,0:05:07.853 Anteriormente, para calcular [br]a média era assim. 0:05:07.853,0:05:12.478 Agora nós precisamos calcular [br]a mediana, essa outra instrução. 0:05:12.478,0:05:15.426 "Rafa, a mediana de qual [br]conjunto de dados?" 0:05:15.426,0:05:18.525 Olha, vamos selecionar [br]esse conjunto de dados. 0:05:18.525,0:05:19.885 Está armazenado aonde? 0:05:19.885,0:05:20.961 Dentro de vendas. 0:05:21.787,0:05:25.457 Então nós vamos digitar[br]vendas aqui e apertar o Enter. 0:05:25.457,0:05:26.925 Aí você fala: "Será que funcionou?". 0:05:26.925,0:05:28.453 Se não deu um erro, à princípio sim. 0:05:28.453,0:05:32.347 Mas nós precisamos visualizar [br]qual é a variável 0:05:32.347,0:05:35.267 que armazenou o valor da mediana. 0:05:35.267,0:05:37.770 Está aqui, Control C + Control V. 0:05:37.770,0:05:39.571 "Ah, não, Rafa, eu gosto de digitar." 0:05:39.571,0:05:43.609 Eu tenho uma dica que às vezes é [br]bom você copiar o nome da variável. 0:05:43.609,0:05:46.036 Mas se você quiser por seu risco digitar. 0:05:46.036,0:05:48.614 Lembre-se também da facilidade do R, 0:05:48.614,0:05:50.825 que aparece que tem [br]uma variável com esse nome. 0:05:50.825,0:05:52.785 Ah, é essa mesmo que eu quero. 0:05:52.785,0:05:54.186 Eu vou apertar o Enter. 0:05:54.186,0:05:57.156 O que acabamos de descobrir aqui então? 0:05:57.156,0:06:00.852 Anteriormente, descobrimos [br]que a média desses oito números 0:06:00.852,0:06:04.062 era 162.5, 0:06:04.062,0:06:07.651 e a mediana para esses oito números é 165. 0:06:08.801,0:06:10.671 Alcançamos o nosso segundo objetivo. 0:06:10.671,0:06:14.940 O nosso terceiro e último objetivo [br]para agora é calcular o desvio-padrão 0:06:14.940,0:06:18.198 nesse intervalo desses[br]oito números das vendas. 0:06:18.198,0:06:19.336 Vamos verificar? 0:06:19.336,0:06:21.046 Vem comigo na minha tela aqui. 0:06:21.046,0:06:25.172 Então, como anteriormente, eu [br]deixei aqui um script pré-pronto. 0:06:25.172,0:06:28.799 Eu recomendo novamente a vocês [br]pausarem esse vídeo depois 0:06:28.799,0:06:30.625 e olharem esses comentários, tá? 0:06:30.625,0:06:33.325 Vamos relembrar o que é o desvio-padrão. 0:06:33.325,0:06:37.863 Ele indica a medida de dispersão[br]de um conjunto de dados 0:06:37.863,0:06:40.432 em relação à sua média aritmética. 0:06:40.432,0:06:43.035 "Então, Rafa, como assim [br]um conjunto de dados?". 0:06:43.035,0:06:46.229 O conjunto de dados é esse que temos [br]das vendas, os oito meses, 0:06:46.229,0:06:48.605 em relação à sua média métrica. 0:06:48.605,0:06:54.418 Ele vai analisar e fazer um vínculo [br]entre a média aritmética 0:06:54.418,0:06:57.816 e esse conjunto de dados,[br]que são esses oito valores. 0:06:57.816,0:06:58.898 Como faz isso? 0:06:58.898,0:07:00.012 De novo, é simples. 0:07:00.012,0:07:00.816 Vamos lá? 0:07:00.816,0:07:04.423 Eu deixei o script aqui, o resultado[br]está aqui, mas vamos fazer juntos. 0:07:04.423,0:07:07.896 É legal programarmos [br]junto com vocês aqui, olhe: 0:07:07.896,0:07:14.319 desavio underline padrão underline vendas. 0:07:14.319,0:07:15.233 "O que é isso, Rafa?" 0:07:15.233,0:07:17.869 Eu preciso criar uma variável,[br]como anteriormente, 0:07:17.869,0:07:21.540 que armazene o valor do desvio-padrão [br]desse conjunto de dados. 0:07:21.540,0:07:23.203 Essa daqui é a variável. 0:07:23.203,0:07:25.627 Você pode colocar outro nome. 0:07:25.627,0:07:28.807 Geralmente deixamos o nome [br]para facilitar a compreensão 0:07:28.807,0:07:30.478 do que ela está armazenando. 0:07:30.478,0:07:35.029 "E, Rafa, como é a instrução [br]que calcula o desvio-padrão?" 0:07:35.029,0:07:39.659 Para calcular o desvio-padrão, [br]a instrução é "sd", abro parênteses... 0:07:39.659,0:07:43.328 Onde está armazenado o conjunto de dados? 0:07:43.328,0:07:46.732 O conjunto de dados está [br]armazenado dentro de vendas. 0:07:46.732,0:07:50.802 Então eu coloco aqui o nome [br]do meu conjunto de dados. 0:07:50.802,0:07:52.304 E agora precisamos visualizar. 0:07:52.304,0:07:55.240 Vamos ver qual é o valor do desvio-padrão? 0:07:55.240,0:08:00.579 Você pode copiar ou colar, ou você[br]digita o começo da variável, e o R fala: 0:08:00.579,0:08:02.922 "Eu acho que é essa". 0:08:02.922,0:08:04.282 Aperto o Enter. 0:08:04.282,0:08:07.719 Então o valor do meu desvio-padrão[br]para esse conjunto de dados, 0:08:07.719,0:08:13.280 esses oito meses das vendas, é 28.15772. 0:08:13.280,0:08:16.349 Ótimo, conseguimos [br]alcançar nosso objetivo. 0:08:16.349,0:08:21.900 Com a linguagem R, aprendemos a calcular [br]a média, mediana e o desvio-padrão. 0:08:21.900,0:08:24.174 E agora fica aquele desafio de sempre, né? 0:08:24.174,0:08:26.304 Busque um conjunto de valores de dados, 0:08:26.304,0:08:30.175 seja da sua vida financeira ou alguma [br]outra informação que você tenha, 0:08:30.175,0:08:33.442 e também coloque em prática[br]a média, mediana e desvio-padrão.