WEBVTT 00:00:07.900 --> 00:00:11.578 Você já teve a necessidade de fazer a sua média salarial, 00:00:11.578 --> 00:00:15.915 calcular a média das suas notas ou qualquer outro tipo de média? 00:00:15.915 --> 00:00:18.518 E é isso então que eu vou ensinar hoje para vocês. 00:00:18.518 --> 00:00:21.688 Mas não pense que será no Excel ou em uma calculadora. 00:00:21.688 --> 00:00:24.891 Nós iremos fazer isso dentro da linguagem R. 00:00:24.891 --> 00:00:27.300 Vem comigo que eu vou mostrar para vocês como fazer isso. 00:00:27.300 --> 00:00:31.041 Eu já deixei aqui para vocês um script pronto, e aí você fala: 00:00:31.041 --> 00:00:33.233 "Pô, Rafa, mas o que nós iremos fazer? 00:00:33.233 --> 00:00:34.412 Só executar? 00:00:34.412 --> 00:00:35.702 Gente, só executar. 00:00:35.702 --> 00:00:38.371 Aqui estão os valores e aqui estão os resultados. 00:00:38.371 --> 00:00:41.474 Com certeza esse não é o meu objetivo com vocês, tá? 00:00:41.474 --> 00:00:42.342 O script está aqui. 00:00:42.342 --> 00:00:45.079 Toda vez que você vir essa hashtag, 00:00:45.079 --> 00:00:47.889 é um comentário que ele está ignorando na execução 00:00:47.889 --> 00:00:50.917 e o restante aqui, ou eu estou pedindo para ele fazer algo, 00:00:50.917 --> 00:00:54.187 uma execução, uma atribuição de um valor, ou mostrar em tela. 00:00:54.187 --> 00:00:55.671 Então vamos pegar aqui por partes 00:00:55.671 --> 00:00:59.618 para não precisarmos executar junto com computador, tudo bem? 00:00:59.618 --> 00:01:03.056 Se pegarmos aqui esses primeiros dados de vendas mensais, 00:01:03.056 --> 00:01:06.232 teremos aqui a variável vendas. 00:01:06.232 --> 00:01:11.704 Nós estamos atribuindo oito conjuntos de valores para dentro de vendas aqui. 00:01:11.704 --> 00:01:15.949 Vamos supor: mês um, mês dois, mês três, mês quatro, 00:01:15.949 --> 00:01:19.312 mês cinco, mês seis, mês sete, mês oito. 00:01:19.312 --> 00:01:22.248 Então nós temos aqui as vendas de oito meses. 00:01:22.248 --> 00:01:23.354 Atribuímos. 00:01:23.354 --> 00:01:24.584 E aqui nós mostramos. 00:01:24.584 --> 00:01:28.288 Quando fazemos isso, aparece esses valores. 00:01:28.288 --> 00:01:31.741 Legal, então nós temos um conjunto de valores de vendas aí. 00:01:31.741 --> 00:01:33.526 O que nós podemos fazer agora? 00:01:33.526 --> 00:01:36.929 Pegar esses oito valores e achar a média. 00:01:36.929 --> 00:01:40.360 De cabeça, talvez você já consiga imaginar como será, né? o computador. 00:01:40.360 --> 00:01:41.634 O computador vai fazer o quê? 00:01:41.634 --> 00:01:45.805 Pegar os oito valores, somar todos esses valores, e dividir por oito. 00:01:45.805 --> 00:01:47.306 Então acharemos a média. 00:01:47.306 --> 00:01:49.193 Vamos ver como fazer isso com o R? 00:01:49.193 --> 00:01:55.081 Eu deixei para vocês um script pré-pronto aqui, mas vamos rodar juntos. 00:01:55.081 --> 00:01:56.015 O que seria isso? 00:01:56.015 --> 00:01:58.184 Tem uma variável chamada vendas. 00:01:58.184 --> 00:02:01.954 Nessa variável, nós temos um conjunto de valores. 00:02:01.954 --> 00:02:04.490 Vamos supor que nós temos oito meses. 00:02:04.490 --> 00:02:08.828 Precisamos representar então mês um, mês dois, mês três, mês quatro, 00:02:08.828 --> 00:02:12.899 mês cinco, mês seis, mês sete, mês oito. 00:02:12.899 --> 00:02:16.035 Então esses são os valores das vendas de oito meses. 00:02:16.035 --> 00:02:20.571 Se eu apertar o Enter, eu atribuo esses oito valores à variável vendas. 00:02:20.571 --> 00:02:25.050 E agora eu vou apertar, dar a instrução print, 00:02:25.050 --> 00:02:27.280 o nome da variável vendas, 00:02:27.280 --> 00:02:29.853 e nós vamos conseguir visualizar os oito valores. 00:02:30.460 --> 00:02:33.519 Agora nós vamos para o nosso primeiro objetivo 00:02:33.519 --> 00:02:36.109 calcular a média desses oito valores. 00:02:36.109 --> 00:02:39.358 Na sua cabeça, você já deve ter feito... 00:02:39.358 --> 00:02:44.130 Abriu o seu Excel, a sua calculadora, somou os oito valores e dividiu por oito. 00:02:44.130 --> 00:02:45.594 Sim, está certo o que você fez, 00:02:45.594 --> 00:02:47.934 mas vamos aprender a fazer isso com R? 00:02:47.934 --> 00:02:50.340 Não é difícil, é bem simples. Vem comigo. 00:02:50.340 --> 00:02:53.139 O que nós precisamos fazer agora? 00:02:53.139 --> 00:02:55.942 Nós precisamos criar uma nova variável. 00:02:55.942 --> 00:02:59.812 Vamos chamá-la de "media_vendas", ok? 00:02:59.812 --> 00:03:03.112 Inclusive eu estou usando a mesma coisa que está no script aqui, tá, 00:03:03.112 --> 00:03:04.474 para não precisarmos ficar mudando muito. 00:03:04.474 --> 00:03:06.935 "Rafa, eu posso dar um nome de outra variável?" 00:03:06.935 --> 00:03:09.155 Pode. Fique à vontade. 00:03:09.155 --> 00:03:12.224 Essa é instrução que calcula a média. 00:03:12.224 --> 00:03:14.156 E agora? Qual o intervalo de valores? 00:03:14.156 --> 00:03:15.036 Onde estão? 00:03:15.036 --> 00:03:16.596 Estão dentro de vendas. 00:03:16.596 --> 00:03:20.199 Então eu estou pedindo para o R pegar todos os valores 00:03:20.199 --> 00:03:25.638 que estão dentro de vendas e calcular média através dessa instrução, 00:03:25.638 --> 00:03:29.141 e atribuir ao valor da média dentro dessa variável. 00:03:29.141 --> 00:03:32.578 Vamos apertar o Enter, e agora precisamos visualizar 00:03:32.578 --> 00:03:35.648 o que foi armazenado dentro dessa variável. 00:03:35.648 --> 00:03:37.484 Vamos ver qual é a média então? 00:03:37.484 --> 00:03:38.884 Se apertar o Enter... 00:03:38.884 --> 00:03:44.957 A média então desses oito valores é 16.,5. 00:03:44.957 --> 00:03:46.599 O primeiro objetivo foi alcançado. 00:03:46.599 --> 00:03:49.395 Vamos evoluir mais um pouco agora? 00:03:49.395 --> 00:03:53.909 Agora nós vamos aprender a calcular a mediana. 00:03:53.909 --> 00:03:58.237 Voltando para a tela, eu deixei aqui um comentário, tá? 00:03:58.237 --> 00:04:01.307 Você pode escutar o que eu vou falar e anotar, 00:04:01.507 --> 00:04:04.176 ou você também pode olhar os materiais de estudos, 00:04:04.176 --> 00:04:08.380 ou também está aqui um breve resumo do que é a mediana. 00:04:08.614 --> 00:04:11.617 Puxando aqui para a parte da estatística, nós estamos mexendo. 00:04:11.750 --> 00:04:14.286 É uma medida estatística que representa o valor central em um conjunto de dados. 00:04:17.289 --> 00:04:18.357 Qual é o conjunto de dados? 00:04:18.357 --> 00:04:20.292 "Nossa, Rafa, é esse conjunto." 00:04:20.292 --> 00:04:22.495 Vamos continuar trabalhando neles para facilitar, tudo bem? 00:04:22.495 --> 00:04:24.930 "Rafa, tem um outro conjunto de dados." 00:04:24.930 --> 00:04:30.569 Aplique então. 00:04:30.669 --> 00:04:33.073 e a média central desse conjunto de dados organizados 00:04:33.073 --> 00:04:34.073 de forma crescente ou decrescente? 00:04:34.073 --> 00:04:37.376 Nesse caso, não está organizado. 00:04:37.510 --> 00:04:38.844 "Poxa, Rafa, ele não está." 00:04:38.844 --> 00:04:41.080 Vamos ver como fazemos isso. 00:04:41.080 --> 00:04:42.615 A web vai nos ajudar. 00:04:42.615 --> 00:04:45.317 Se vocês verificarem, nós temos esse script pronto e os comentários. 00:04:45.317 --> 00:04:48.120 Mas vamos fazer juntos, tudo bem? 00:04:48.988 --> 00:04:50.155 Então nós vamos fazer o quê? 00:04:50.155 --> 00:04:52.658 Como anteriormente, nós vamos criar uma variável, 00:04:52.658 --> 00:04:56.528 nós vamos chamar média vendas, vamos chamar a mediana: 00:04:56.595 --> 00:05:00.699 vendas, sinal de menor, sinal de atribuição. 00:05:00.766 --> 00:05:03.969 E o que precisávamos fazer anteriormente para calcular a média era assim. 00:05:04.069 --> 00:05:07.806 agora a média. 00:05:07.873 --> 00:05:10.809 Agora nós precisamos calcular a mediana, essa outra instrução. 00:05:12.478 --> 00:05:13.779 Rafa, de qual conjunto de dados nós vamos selecionar a mediana? 00:05:17.216 --> 00:05:19.885 Aonde esse conjunto de dados está armazenado? 00:05:19.885 --> 00:05:21.687 Dentro de vendas. 00:05:21.787 --> 00:05:22.321 Então nós vamos digitar aqui vendas e apertar o Enter. 00:05:25.457 --> 00:05:26.925 Aí você fala: "Será que funcionou?". 00:05:26.925 --> 00:05:27.593 Se não, deu um erro. 00:05:27.593 --> 00:05:30.596 A princípio sim, mas nós precisamos visualizar 00:05:30.663 --> 00:05:35.134 qual é a variável que armazena o valor da mediana. 00:05:35.267 --> 00:05:37.770 Está aqui, Control C + Control V. 00:05:37.770 --> 00:05:39.571 "Ah, não, Rafa, eu gosto de digitar." 00:05:39.571 --> 00:05:43.609 Eu tenho uma dica que às vezes é bom você copiar o nome da variável. 00:05:43.609 --> 00:05:47.646 Mas se você quiser, é um risco seu digitar. 00:05:47.646 --> 00:05:48.614 Lembre-se também da facilidade do R. 00:05:48.614 --> 00:05:51.785 Me parece que tem uma variável com esse nome. 00:05:51.785 --> 00:05:52.785 Essa mesmo que eu quero, 00:05:52.785 --> 00:05:54.186 Eu vou apertar o Enter. 00:05:54.186 --> 00:05:57.156 O que acabamos de descobrir aqui então? 00:05:57.156 --> 00:05:57.689 A média. 00:05:57.689 --> 00:06:00.692 Anteriormente, descobrimos que a média desses oito números 00:06:00.859 --> 00:06:03.862 era 107, tem 62,5. 00:06:04.062 --> 00:06:08.801 É a mediana para esses oito números, é um meio cinco. 00:06:08.801 --> 00:06:10.903 Alcançamos o nosso segundo objetivo. 00:06:10.903 --> 00:06:14.907 Nosso terceiro e último objetivo para agora é calcular o desvio padrão 00:06:14.940 --> 00:06:19.211 nesse intervalo desses oito números das vendas. 00:06:19.278 --> 00:06:21.046 Vamos verificar. Vem comigo na minha tela aqui. 00:06:21.046 --> 00:06:26.485 Então, como anteriormente, eu deixei aqui um script pré-pronto. 00:06:26.652 --> 00:06:30.589 Eu recomendo novamente a vocês pausarem esse vídeo depois 00:06:30.689 --> 00:06:32.325 e olharem esses comentários. 00:06:32.325 --> 00:06:33.325 Vamos relembrar o que é o desvio padrão. 00:06:33.325 --> 00:06:37.863 Ele indica a medida de dispersão de um conjunto de dados 00:06:37.963 --> 00:06:40.432 em relação à sua média aritmética. 00:06:40.432 --> 00:06:43.035 "Então, Rafa, como assim um conjunto de dados?". 00:06:43.035 --> 00:06:43.869 O conjunto de dados? 00:06:43.869 --> 00:06:47.005 É isso que temos nas vendas dos oito meses em relação à sua média métrica. 00:06:47.005 --> 00:06:51.643 Ele vai analisar e fazer um vínculo entre a média aritmética e esse conjunto de dados, 00:06:53.378 --> 00:06:57.716 que são esses outros valores. 00:06:57.816 --> 00:06:59.918 Como faz isso de novo? 00:06:59.918 --> 00:07:00.786 É simples. Vamos lá! 00:07:00.786 --> 00:07:04.423 Eu deixei o script aqui, o resultado está aqui, mas vamos fazer juntos. 00:07:04.423 --> 00:07:07.592 É legal programarmos junto com vocês aqui o desvio. 00:07:10.996 --> 00:07:14.299 underline padrão, padrão, underline, vendas. 00:07:14.399 --> 00:07:15.233 "O que é isso, Rafa?" 00:07:15.233 --> 00:07:17.869 Eu preciso criar uma variável, como anteriormente, 00:07:17.869 --> 00:07:21.440 que armazene o valor do desvio padrão desse conjunto de dados. 00:07:21.540 --> 00:07:24.743 Esse daqui, essa daqui. 00:07:24.743 --> 00:07:27.847 Você pode colocar outro nome na variável, tudo bem? 00:07:27.847 --> 00:07:28.847 Geralmente deixamos o nome para facilitar a compreensão. 00:07:28.847 --> 00:07:32.718 O que ela está armazenando é Rafa, como a instrução 00:07:32.784 --> 00:07:37.389 que calcula o desvio padrão para calcular o desvio padrão, a instrução 00:07:37.389 --> 00:07:43.161 SD abre parênteses Qual que é o conjunto onde está armazenado o conjunto de dados? 00:07:43.328 --> 00:07:46.665 O conjunto de dados está armazenado dentro de vendas. 00:07:46.732 --> 00:07:50.735 Então eu coloco aqui o nome do meu conjunto de dados. 00:07:50.802 --> 00:07:52.304 E agora, gente, é só visualizar. 00:07:52.304 --> 00:07:55.240 Vamos ver qual é o valor do desvio padrão. 00:07:55.240 --> 00:08:00.445 Você pode copiar/colar, ou você digitar o começo da variável, o R fala 00:08:00.579 --> 00:08:03.282 Eu acho que é isso mesmo. 00:08:03.282 --> 00:08:04.282 Apertei Enter. 00:08:04.282 --> 00:08:07.719 Então o valor do meu desvio padrão para esse conjunto de dados, 00:08:07.719 --> 00:08:13.625 esses oito meses das vendas, é 28,15772. 00:08:13.692 --> 00:08:14.259 Ótimo! 00:08:14.259 --> 00:08:18.063 Conseguimos alcançar nosso objetivo, aprendemos com a linguagem R 00:08:18.063 --> 00:08:21.800 a calcular a média mediana e o desvio padrão. 00:08:21.900 --> 00:08:26.304 E agora fica aquele desafio de sempre buscar um conjunto de valores de dados, 00:08:26.304 --> 00:08:30.108 seja da sua vida financeira ou alguma outra informação que você tenha. 00:08:30.175 --> 00:08:33.912 E também coloque em prática a média mediana e desvio padrão.