0:00:07.900,0:00:11.578 Você já teve a necessidade [br]de fazer a sua média salarial, 0:00:11.578,0:00:15.915 calcular a média das suas notas[br]ou qualquer outro tipo de média? 0:00:15.915,0:00:18.518 E é isso então que eu vou [br]ensinar hoje para vocês. 0:00:18.518,0:00:21.688 Mas não pense que será no Excel[br]ou em uma calculadora. 0:00:21.688,0:00:24.891 Nós iremos fazer isso [br]dentro da linguagem R. 0:00:24.891,0:00:27.300 Vem comigo que eu vou mostrar [br]para vocês como fazer isso. 0:00:27.300,0:00:31.041 Eu já deixei aqui para vocês um script[br]pronto, e aí você fala: 0:00:31.041,0:00:33.233 "Pô, Rafa, mas o que nós iremos fazer? 0:00:33.233,0:00:34.412 Só executar? 0:00:34.412,0:00:35.702 Gente, só executar. 0:00:35.702,0:00:38.371 Aqui estão os valores[br]e aqui estão os resultados. 0:00:38.371,0:00:41.474 Com certeza esse não é [br]o meu objetivo com vocês, tá? 0:00:41.474,0:00:42.342 O script está aqui. 0:00:42.342,0:00:45.079 Toda vez que você vir essa hashtag, 0:00:45.079,0:00:47.889 é um comentário que ele [br]está ignorando na execução 0:00:47.889,0:00:50.917 e o restante aqui, ou eu estou [br]pedindo para ele fazer algo, 0:00:50.917,0:00:54.187 uma execução, uma atribuição [br]de um valor, ou mostrar em tela. 0:00:54.187,0:00:55.671 Então vamos pegar aqui por partes 0:00:55.671,0:00:59.618 para não precisarmos executar [br]junto com computador, tudo bem? 0:00:59.618,0:01:03.056 Se pegarmos aqui esses [br]primeiros dados de vendas mensais, 0:01:03.056,0:01:06.232 teremos aqui a variável vendas. 0:01:06.232,0:01:11.704 Nós estamos atribuindo oito conjuntos [br]de valores para dentro de vendas aqui. 0:01:11.704,0:01:15.949 Vamos supor: mês um, [br]mês dois, mês três, mês quatro, 0:01:15.949,0:01:19.312 mês cinco, mês seis, mês sete, mês oito. 0:01:19.312,0:01:22.248 Então nós temos aqui [br]as vendas de oito meses. 0:01:22.248,0:01:23.354 Atribuímos. 0:01:23.354,0:01:24.584 E aqui nós mostramos. 0:01:24.584,0:01:28.288 Quando fazemos isso,[br]aparece esses valores. 0:01:28.288,0:01:31.741 Legal, então nós temos [br]um conjunto de valores de vendas aí. 0:01:31.741,0:01:33.526 O que nós podemos fazer agora? 0:01:33.526,0:01:36.929 Pegar esses oito valores e achar a média. 0:01:36.929,0:01:40.900 De cabeça, talvez você já consiga [br]imaginar como será, né? o computador. 0:01:40.900,0:01:41.634 O computador vai fazer o quê? 0:01:41.634,0:01:44.170 Pegar os oito valores, somar [br]todos esses valores e dividir por oito, 0:01:45.805,0:01:47.306 então acharemos a média. 0:01:47.306,0:01:49.409 Vamos ver como fazer isso com Warren. 0:01:49.409,0:01:52.812 Então eu deixei para vocês um script [br]pré-pronto, mas vamos rodar juntos. 0:01:55.081,0:01:56.015 O que seria isso? 0:01:56.015,0:01:58.184 Tem uma variável chamada vendas. 0:01:58.184,0:02:01.754 Nessa variável, nós temos [br]um conjunto de valores. 0:02:01.954,0:02:04.490 Vamos supor que nós temos oito meses. 0:02:04.490,0:02:08.828 Precisamos representar[br]então mês um, mês dois, mês três, mês quatro, 0:02:08.828,0:02:12.799 mês cinco, seis, sete, mês oito. 0:02:12.899,0:02:15.902 Então esses são os valores [br]das vendas de oito meses. 0:02:16.035,0:02:18.871 Se eu apertar o Enter, eu atribuo[br]esses oito valores à variável vendas. 0:02:18.871,0:02:21.874 E agora eu vou apertar, dar a instrução [br]print, o nome da variável vendas, 0:02:27.280,0:02:30.583 e nós vamos conseguir [br]visualizar os oito valores. 0:02:30.650,0:02:33.519 Agora nós vamos [br]para o nosso primeiro objetivo 0:02:33.519,0:02:36.989 calcular a média desses [br]oito valores. 0:02:37.089,0:02:39.358 Na sua cabeça,, você já deve ter feito... 0:02:39.358,0:02:44.130 Abriu o seu Excel, a sua calculadora,[br]somou os oito valores e dividiu por oito. 0:02:44.230,0:02:46.934 Sim, está certo o que você fez. 0:02:46.934,0:02:47.934 Mas vamos aprender a fazer isso com R. 0:02:47.934,0:02:50.937 Não é difícil, é bem simples. Vem comigo. 0:02:51.070,0:02:53.139 O que nós precisamos fazer agora? 0:02:53.139,0:02:55.942 Nós precisamos criar uma nova variável. 0:02:55.942,0:02:59.779 Vamos chamá-la de "média vendas", ok? 0:02:59.812,0:03:03.082 Inclusive eu estou usando a mesma [br]coisa que está no script aqui, tá, 0:03:03.115,0:03:04.884 para não precisarmos ficar mudando muito. 0:03:04.884,0:03:08.155 Eu posso dar um nome de outra variável. 0:03:08.155,0:03:09.155 Pode ficar à vontade. 0:03:09.155,0:03:12.158 Essa instrução que calcula a média. 0:03:12.224,0:03:16.495 E agora quais com intervalo de valores[br]está onde está dentro de vendas. 0:03:16.596,0:03:20.199 Então eu estou pedindo [br]para o R pegar todos os valores 0:03:20.199,0:03:25.638 que estão dentro de vendas,[br]calcular média através dessa instrução, 0:03:25.705,0:03:29.141 e atribuir ao valor da média[br]dentro dessa variável. 0:03:29.208,0:03:32.378 Vamos apertar o Enter,[br]e agora é só visualizarmos 0:03:32.578,0:03:35.648 o que foi armazenado[br]dentro dessa variável. 0:03:35.648,0:03:37.884 Vamos ver qual é a média. 0:03:37.884,0:03:38.884 Então é só apertar o Enter. 0:03:38.884,0:03:44.890 A média então desses oito valores é 162,5. 0:03:44.957,0:03:47.193 O primeiro objetivo foi alcançado. 0:03:47.193,0:03:49.395 Vamos evoluir mais um pouco agora. 0:03:49.395,0:03:52.264 Agora nós vamos aprender [br]a calcular a mediana. 0:03:53.532,0:03:58.237 Eu deixei aqui voltando para atela[br]para que vocês um comentário. 0:03:58.304,0:04:01.307 Você pode escutar [br]o que eu vou falar e anotar, 0:04:01.507,0:04:04.176 ou você também pode [br]olhar os materiais de estudos, 0:04:04.176,0:04:08.380 ou também está aqui um breve [br]resumo do que é a mediana. 0:04:08.614,0:04:11.617 Puxando aqui para a parte da estatística,[br]nós estamos mexendo. 0:04:11.750,0:04:14.286 É uma medida estatística que representa[br]o valor central em um conjunto de dados. 0:04:17.289,0:04:18.357 Qual é o conjunto de dados? 0:04:18.357,0:04:20.292 "Nossa, Rafa, é esse conjunto." 0:04:20.292,0:04:22.495 Vamos continuar[br]trabalhando neles para facilitar, tudo bem? 0:04:22.495,0:04:24.930 "Rafa, tem um outro conjunto de dados." 0:04:24.930,0:04:30.569 Aplique então. 0:04:30.669,0:04:33.073 e a média central desse [br]conjunto de dados organizados 0:04:33.073,0:04:34.073 de forma crescente ou decrescente? 0:04:34.073,0:04:37.376 Nesse caso, não está organizado. 0:04:37.510,0:04:38.844 "Poxa, Rafa, ele não está." 0:04:38.844,0:04:41.080 Vamos ver como fazemos isso. 0:04:41.080,0:04:42.615 A web vai nos ajudar. 0:04:42.615,0:04:45.317 Se vocês verificarem, nós temos [br]esse script pronto e os comentários. 0:04:45.317,0:04:48.120 Mas vamos fazer juntos, tudo bem? 0:04:48.988,0:04:50.155 Então nós vamos fazer o quê? 0:04:50.155,0:04:52.658 Como anteriormente,[br]nós vamos criar uma variável, 0:04:52.658,0:04:56.528 nós vamos chamar média vendas,[br]vamos chamar a mediana: 0:04:56.595,0:05:00.699 vendas, sinal de menor, sinal de atribuição. 0:05:00.766,0:05:03.969 E o que precisávamos fazer anteriormente[br]para calcular a média era assim. 0:05:04.069,0:05:07.806 agora a média. 0:05:07.873,0:05:10.809 Agora nós precisamos calcular [br]a mediana, essa outra instrução. 0:05:12.478,0:05:13.779 Rafa, de qual conjunto de dados[br]nós vamos selecionar a mediana? 0:05:17.216,0:05:19.885 Aonde esse conjunto [br]de dados está armazenado? 0:05:19.885,0:05:21.687 Dentro de vendas. 0:05:21.787,0:05:22.321 Então nós vamos digitar aqui [br]vendas e apertar o Enter. 0:05:25.457,0:05:26.925 Aí você fala: "Será que funcionou?". 0:05:26.925,0:05:27.593 Se não, deu um erro. 0:05:27.593,0:05:30.596 A princípio sim, mas nós[br]precisamos visualizar 0:05:30.663,0:05:35.134 qual é a variável que armazena[br]o valor da mediana. 0:05:35.267,0:05:37.770 Está aqui, Control C + Control V. 0:05:37.770,0:05:39.571 "Ah, não, Rafa, eu gosto de digitar." 0:05:39.571,0:05:43.609 Eu tenho uma dica que às vezes é [br]bom você copiar o nome da variável. 0:05:43.609,0:05:47.646 Mas se você quiser, [br]é um risco seu digitar. 0:05:47.646,0:05:48.614 Lembre-se também da facilidade do R. 0:05:48.614,0:05:51.785 Me parece que tem [br]uma variável com esse nome. 0:05:51.785,0:05:52.785 Essa mesmo que eu quero, 0:05:52.785,0:05:54.186 Eu vou apertar o Enter. 0:05:54.186,0:05:57.156 O que acabamos de descobrir aqui então? 0:05:57.156,0:05:57.689 A média. 0:05:57.689,0:06:00.692 Anteriormente, descobrimos[br]que a média desses oito números 0:06:00.859,0:06:03.862 era 107, tem 62,5. 0:06:04.062,0:06:08.801 É a mediana para esses oito números,[br]é um meio cinco. 0:06:08.801,0:06:10.903 Alcançamos o nosso segundo objetivo. 0:06:10.903,0:06:14.907 Nosso terceiro e último objetivo para[br]agora é calcular o desvio padrão 0:06:14.940,0:06:19.211 nesse intervalo desses[br]oito números das vendas. 0:06:19.278,0:06:21.046 Vamos verificar. Vem [br]comigo na minha tela aqui. 0:06:21.046,0:06:26.485 Então, como anteriormente, eu [br]deixei aqui um script pré-pronto. 0:06:26.652,0:06:30.589 Eu recomendo novamente a vocês [br]pausarem esse vídeo depois 0:06:30.689,0:06:32.325 e olharem esses comentários. 0:06:32.325,0:06:33.325 Vamos relembrar o que é o desvio padrão. 0:06:33.325,0:06:37.863 Ele indica a medida de dispersão[br]de um conjunto de dados 0:06:37.963,0:06:40.432 em relação à sua média aritmética. 0:06:40.432,0:06:43.035 "Então, Rafa, como assim [br]um conjunto de dados?". 0:06:43.035,0:06:43.869 O conjunto de dados? 0:06:43.869,0:06:47.005 É isso que temos nas vendas dos oito [br]meses em relação à sua média métrica. 0:06:47.005,0:06:51.643 Ele vai analisar e fazer um vínculo entre [br]a média aritmética e esse conjunto de dados, 0:06:53.378,0:06:57.716 que são esses outros valores. 0:06:57.816,0:06:59.918 Como faz isso de novo? 0:06:59.918,0:07:00.786 É simples. Vamos lá! 0:07:00.786,0:07:04.423 Eu deixei o script aqui, o resultado[br]está aqui, mas vamos fazer juntos. 0:07:04.423,0:07:07.592 É legal programarmos junto [br]com vocês aqui o desvio. 0:07:10.996,0:07:14.299 underline padrão, padrão, underline, vendas. 0:07:14.399,0:07:15.233 "O que é isso, Rafa?" 0:07:15.233,0:07:17.869 Eu preciso criar uma variável,[br]como anteriormente, 0:07:17.869,0:07:21.440 que armazene o valor do desvio [br]padrão desse conjunto de dados. 0:07:21.540,0:07:24.743 Esse daqui, essa daqui. 0:07:24.743,0:07:27.847 Você pode colocar outro [br]nome na variável, tudo bem? 0:07:27.847,0:07:28.847 Geralmente deixamos o nome [br]para facilitar a compreensão. 0:07:28.847,0:07:32.718 O que ela está armazenando[br]é Rafa, como a instrução 0:07:32.784,0:07:37.389 que calcula o desvio padrão[br]para calcular o desvio padrão, a instrução 0:07:37.389,0:07:43.161 SD abre parênteses Qual que é o conjunto[br]onde está armazenado o conjunto de dados? 0:07:43.328,0:07:46.665 O conjunto de dados está [br]armazenado dentro de vendas. 0:07:46.732,0:07:50.735 Então eu coloco aqui o nome [br]do meu conjunto de dados. 0:07:50.802,0:07:52.304 E agora, gente, é só visualizar. 0:07:52.304,0:07:55.240 Vamos ver qual é o valor do desvio padrão. 0:07:55.240,0:08:00.445 Você pode copiar/colar, ou você[br]digitar o começo da variável, o R fala 0:08:00.579,0:08:03.282 Eu acho que é isso mesmo. 0:08:03.282,0:08:04.282 Apertei Enter. 0:08:04.282,0:08:07.719 Então o valor do meu desvio padrão[br]para esse conjunto de dados, 0:08:07.719,0:08:13.625 esses oito meses das vendas, é 28,15772. 0:08:13.692,0:08:14.259 Ótimo! 0:08:14.259,0:08:18.063 Conseguimos alcançar nosso objetivo,[br]aprendemos com a linguagem R 0:08:18.063,0:08:21.800 a calcular a média mediana [br]e o desvio padrão. 0:08:21.900,0:08:26.304 E agora fica aquele desafio de sempre[br]buscar um conjunto de valores de dados, 0:08:26.304,0:08:30.108 seja da sua vida financeira ou alguma [br]outra informação que você tenha. 0:08:30.175,0:08:33.912 E também coloque em prática[br]a média mediana e desvio padrão.