WEBVTT 00:00:08.007 --> 00:00:08.441 Você já teve a necessidade de fazer a sua média salarial, 00:00:11.578 --> 00:00:15.949 calcular a média das suas notas ou qualquer outro tipo de média? 00:00:16.015 --> 00:00:18.518 E é isso então que eu vou ensinar hoje para vocês. 00:00:18.518 --> 00:00:21.521 Mas não pense que será no Excel ou em uma calculadora. 00:00:21.688 --> 00:00:24.691 Nós iremos fazer isso dentro da linguagem aqui. 00:00:24.891 --> 00:00:27.660 Vem comigo que eu vou mostrar para vocês como fazer isso. 00:00:27.660 --> 00:00:31.931 Eu já deixei aqui para vocês um script pronto, e aí você fala: 00:00:31.998 --> 00:00:33.233 "Poxa, mas o que nós iremos fazer?". 00:00:33.233 --> 00:00:35.702 É só executar, gente, só executar. 00:00:35.702 --> 00:00:38.371 Aqui estão os valores, aqui estão os resultados. 00:00:38.371 --> 00:00:41.374 Com certeza esse não é um objetivo com vocês. 00:00:41.474 --> 00:00:42.342 O script está aqui. 00:00:42.342 --> 00:00:45.945 Toda vez que você vê essa tag e o comentário que ele está ignorando na execução 00:00:46.079 --> 00:00:50.850 e o restante aqui, eu estou pedindo para ele fazer algo. 00:00:50.917 --> 00:00:53.187 Uma execução é uma atribuição de um valor. 00:00:53.187 --> 00:00:54.187 Eu vou mostrar em tela. 00:00:54.187 --> 00:00:55.021 Então vamos pegar aqui por partes 00:00:55.021 --> 00:00:58.858 para não precisarmos executar junto com computador. 00:00:58.958 --> 00:01:01.861 Tudo bem se pegarmos aqui esses primeiros dados de vendas mensais. 00:01:01.861 --> 00:01:06.165 Temos aqui a variável vendas. 00:01:06.232 --> 00:01:08.902 Nós estamos atribuindo oito conjunto de valores para dentro de vendas aqui. 00:01:11.704 --> 00:01:12.639 Vamos supor: mês um, mês dois, mês três, mês quatro, 00:01:16.109 --> 00:01:19.112 cinco, seis sete, mês oito. 00:01:19.312 --> 00:01:22.248 Então nós temos aqui as vendas de oito meses. 00:01:22.248 --> 00:01:23.584 Atribuímos. 00:01:23.584 --> 00:01:24.584 E aqui nós mostramos. 00:01:24.584 --> 00:01:28.187 Quando fazemos isso, aparece esses valores. 00:01:28.288 --> 00:01:28.855 "Legal, Rafa, então nós temos um conjunto de valores de vendas aí. 00:01:31.924 --> 00:01:33.526 O que nós podemos fazer agora?". 00:01:33.526 --> 00:01:36.829 Pegar esses oito valores e achar a média. 00:01:36.929 --> 00:01:40.900 Talvez de cabeça você já consiga imaginar como será o computador. 00:01:40.900 --> 00:01:41.634 Vai fazer o quê? 00:01:41.634 --> 00:01:44.170 Pegar os oito valores, somar todos esses valores e dividir por oito, 00:01:45.805 --> 00:01:47.306 então acharemos a média. 00:01:47.306 --> 00:01:49.409 Vamos ver como fazer isso com Warren. 00:01:49.409 --> 00:01:52.812 Então eu deixei para vocês um script pré-pronto, mas vamos rodar juntos. 00:01:55.081 --> 00:01:56.015 O que seria isso? 00:01:56.015 --> 00:01:58.184 Tem uma variável chamada vendas. 00:01:58.184 --> 00:02:01.754 Nessa variável, nós temos um conjunto de valores. 00:02:01.954 --> 00:02:04.490 Vamos supor que nós temos oito meses. 00:02:04.490 --> 00:02:08.828 Precisamos representar então mês um, mês dois, mês três, mês quatro, 00:02:08.828 --> 00:02:12.799 mês cinco, seis, sete, mês oito. 00:02:12.899 --> 00:02:15.902 Então esses são os valores das vendas de oito meses. 00:02:16.035 --> 00:02:18.871 Se eu apertar o Enter, eu atribuo esses oito valores à variável vendas. 00:02:18.871 --> 00:02:21.874 E agora eu vou apertar, dar a instrução print, o nome da variável vendas, 00:02:27.280 --> 00:02:30.583 e nós vamos conseguir visualizar os oito valores. 00:02:30.650 --> 00:02:33.519 Agora nós vamos para o nosso primeiro objetivo 00:02:33.519 --> 00:02:36.989 calcular a média desses oito valores. 00:02:37.089 --> 00:02:39.358 Na sua cabeça,, você já deve ter feito... 00:02:39.358 --> 00:02:44.130 Abriu o seu Excel, a sua calculadora, somou os oito valores e dividiu por oito. 00:02:44.230 --> 00:02:46.934 Sim, está certo o que você fez. 00:02:46.934 --> 00:02:47.934 Mas vamos aprender a fazer isso com R. 00:02:47.934 --> 00:02:50.937 Não é difícil, é bem simples. Vem comigo. 00:02:51.070 --> 00:02:53.139 O que nós precisamos fazer agora? 00:02:53.139 --> 00:02:55.942 Nós precisamos criar uma nova variável. 00:02:55.942 --> 00:02:59.779 Vamos chamá-la de "média vendas", ok? 00:02:59.812 --> 00:03:03.082 Inclusive eu estou usando a mesma coisa que está no script aqui, tá, 00:03:03.115 --> 00:03:04.884 para não precisarmos ficar mudando muito. 00:03:04.884 --> 00:03:08.155 Eu posso dar um nome de outra variável. 00:03:08.155 --> 00:03:09.155 Pode ficar à vontade. 00:03:09.155 --> 00:03:12.158 Essa instrução que calcula a média. 00:03:12.224 --> 00:03:16.495 E agora quais com intervalo de valores está onde está dentro de vendas. 00:03:16.596 --> 00:03:20.199 Então eu estou pedindo para o R pegar todos os valores 00:03:20.199 --> 00:03:25.638 que estão dentro de vendas, calcular média através dessa instrução, 00:03:25.705 --> 00:03:29.141 e atribuir ao valor da média dentro dessa variável. 00:03:29.208 --> 00:03:32.378 Vamos apertar o Enter, e agora é só visualizarmos 00:03:32.578 --> 00:03:35.648 o que foi armazenado dentro dessa variável. 00:03:35.648 --> 00:03:37.884 Vamos ver qual é a média. 00:03:37.884 --> 00:03:38.884 Então é só apertar o Enter. 00:03:38.884 --> 00:03:44.890 A média então desses oito valores é 162,5. 00:03:44.957 --> 00:03:47.193 O primeiro objetivo foi alcançado. 00:03:47.193 --> 00:03:49.395 Vamos evoluir mais um pouco agora. 00:03:49.395 --> 00:03:52.264 Agora nós vamos aprender a calcular a mediana. 00:03:53.532 --> 00:03:58.237 Eu deixei aqui voltando para atela para que vocês um comentário. 00:03:58.304 --> 00:04:01.307 Você pode escutar o que eu vou falar e anotar, 00:04:01.507 --> 00:04:04.176 ou você também pode olhar os materiais de estudos, 00:04:04.176 --> 00:04:08.380 ou também está aqui um breve resumo do que é a mediana. 00:04:08.614 --> 00:04:11.617 Puxando aqui para a parte da estatística, nós estamos mexendo. 00:04:11.750 --> 00:04:14.286 É uma medida estatística que representa o valor central em um conjunto de dados. 00:04:17.289 --> 00:04:18.357 Qual é o conjunto de dados? 00:04:18.357 --> 00:04:20.292 "Nossa, Rafa, é esse conjunto." 00:04:20.292 --> 00:04:22.495 Vamos continuar trabalhando neles para facilitar, tudo bem? 00:04:22.495 --> 00:04:24.930 "Rafa, tem um outro conjunto de dados." 00:04:24.930 --> 00:04:30.569 Aplique então. 00:04:30.669 --> 00:04:33.073 e a média central desse conjunto de dados organizados 00:04:33.073 --> 00:04:34.073 de forma crescente ou decrescente? 00:04:34.073 --> 00:04:37.376 Nesse caso, não está organizado. 00:04:37.510 --> 00:04:38.844 "Poxa, Rafa, ele não está." 00:04:38.844 --> 00:04:41.080 Vamos ver como fazemos isso. 00:04:41.080 --> 00:04:42.615 A web vai nos ajudar. 00:04:42.615 --> 00:04:45.317 Se vocês verificarem, nós temos esse script pronto e os comentários. 00:04:45.317 --> 00:04:48.120 Mas vamos fazer juntos, tudo bem? 00:04:48.988 --> 00:04:50.155 Então nós vamos fazer o quê? 00:04:50.155 --> 00:04:52.658 Como anteriormente, nós vamos criar uma variável, 00:04:52.658 --> 00:04:56.528 nós vamos chamar média vendas, vamos chamar a mediana: 00:04:56.595 --> 00:05:00.699 vendas, sinal de menor, sinal de atribuição. 00:05:00.766 --> 00:05:03.969 E o que precisávamos fazer anteriormente para calcular a média era assim. 00:05:04.069 --> 00:05:07.806 agora a média. 00:05:07.873 --> 00:05:10.809 Agora nós precisamos calcular a mediana, essa outra instrução. 00:05:12.478 --> 00:05:13.779 Rafa, de qual conjunto de dados nós vamos selecionar a mediana? 00:05:17.216 --> 00:05:19.885 Aonde esse conjunto de dados está armazenado? 00:05:19.885 --> 00:05:21.687 Dentro de vendas. 00:05:21.787 --> 00:05:22.321 Então nós vamos digitar aqui vendas e apertar o Enter. 00:05:25.457 --> 00:05:26.925 Aí você fala: "Será que funcionou?". 00:05:26.925 --> 00:05:27.593 Se não, deu um erro. 00:05:27.593 --> 00:05:30.596 A princípio sim, mas nós precisamos visualizar 00:05:30.663 --> 00:05:35.134 qual é a variável que armazena o valor da mediana. 00:05:35.267 --> 00:05:37.770 Está aqui, Control C + Control V. 00:05:37.770 --> 00:05:39.571 "Ah, não, Rafa, eu gosto de digitar." 00:05:39.571 --> 00:05:43.609 Eu tenho uma dica que às vezes é bom você copiar o nome da variável. 00:05:43.609 --> 00:05:47.646 Mas se você quiser, é um risco seu digitar. 00:05:47.646 --> 00:05:48.614 Lembre-se também da facilidade do R. 00:05:48.614 --> 00:05:51.785 Me parece que tem uma variável com esse nome. 00:05:51.785 --> 00:05:52.785 Essa mesmo que eu quero, 00:05:52.785 --> 00:05:54.186 Eu vou apertar o Enter. 00:05:54.186 --> 00:05:57.156 O que acabamos de descobrir aqui então? 00:05:57.156 --> 00:05:57.689 A média. 00:05:57.689 --> 00:06:00.692 Anteriormente, descobrimos que a média desses oito números 00:06:00.859 --> 00:06:03.862 era 107, tem 62,5. 00:06:04.062 --> 00:06:08.801 É a mediana para esses oito números, é um meio cinco. 00:06:08.801 --> 00:06:10.903 Alcançamos o nosso segundo objetivo. 00:06:10.903 --> 00:06:14.907 Nosso terceiro e último objetivo para agora é calcular o desvio padrão 00:06:14.940 --> 00:06:19.211 nesse intervalo desses oito números das vendas. 00:06:19.278 --> 00:06:21.046 Vamos verificar. Vem comigo na minha tela aqui. 00:06:21.046 --> 00:06:26.485 Então, como anteriormente, eu deixei aqui um script pré-pronto. 00:06:26.652 --> 00:06:30.589 Eu recomendo novamente a vocês pausarem esse vídeo depois, 00:06:30.689 --> 00:06:32.325 olhar esses comentários. . 00:06:32.325 --> 00:06:33.325 Vamos relembrar o que é o desvio padrão 00:06:33.325 --> 00:06:37.863 Ele indica a medida de dispersão de um conjunto de dados 00:06:37.963 --> 00:06:40.432 em relação a sua média aritmética. 00:06:40.432 --> 00:06:43.035 Então Rafa, como assim um conjunto de dados? 00:06:43.035 --> 00:06:43.869 O conjunto de dados? 00:06:43.869 --> 00:06:47.005 É isso que a gente tem nas vendas os oito meses em relação 00:06:47.005 --> 00:06:51.643 à sua média métrica, ele vai analisar e fazer 00:06:51.710 --> 00:06:53.378 um vínculo entre a média 00:06:53.378 --> 00:06:57.716 aritmética e esse conjunto de dados, que são esses outros valores. 00:06:57.816 --> 00:06:59.918 Como que faz isso de novo? É simples. 00:06:59.918 --> 00:07:00.786 Vamos lá. 00:07:00.786 --> 00:07:04.423 Eu deixei o script aqui, o resultado está aqui, mas vamos fazer junto. 00:07:04.423 --> 00:07:07.592 É legal a gente programar junto com vocês aqui 00:07:07.626 --> 00:07:10.929 o desvio underline, padrão, 00:07:10.996 --> 00:07:14.299 padrão, underline, vendas. 00:07:14.399 --> 00:07:15.233 Que que é isso Rafa? 00:07:15.233 --> 00:07:17.869 Eu preciso criar uma variável como anteriormente, 00:07:17.869 --> 00:07:21.440 que armazene o valor do desvio padrão desse conjunto de dados. 00:07:21.540 --> 00:07:24.743 Esse daqui, essa, daqui, a variável você pode colocar outro nome. 00:07:24.743 --> 00:07:28.847 Tudo bem, o nome geralmente a gente deixa para facilitar a compreensão. 00:07:28.847 --> 00:07:32.718 O que ela está armazenando é Rafa, como que a instrução 00:07:32.784 --> 00:07:37.389 que calcula o desvio padrão para calcular o desvio padrão, a instrução 00:07:37.389 --> 00:07:43.161 SD abre parênteses Qual que é o conjunto onde está armazenado o conjunto de dados? 00:07:43.328 --> 00:07:46.665 O conjunto de dados está armazenado dentro de vendas? 00:07:46.732 --> 00:07:50.735 Então aqui eu coloco o nome do meu conjunto de dados. 00:07:50.802 --> 00:07:52.304 E agora a gente só visualizar. 00:07:52.304 --> 00:07:55.240 Vamos ver qual que é o valor do desvio padrão. 00:07:55.240 --> 00:08:00.445 Você pode copiar, colar ou você digita o começo da variável, o R fala 00:08:00.579 --> 00:08:04.216 Eu acho que é isso mesmo, apertou enter. 00:08:04.282 --> 00:08:07.719 Então o valor do meu desvio padrão para esse conjunto de dados, 00:08:07.719 --> 00:08:13.625 esses oito meses das vendas é 28,15772. 00:08:13.692 --> 00:08:14.259 Ótimo! 00:08:14.259 --> 00:08:18.063 Conseguimos alcançar nosso objetivo, aprendemos com a linguagem 00:08:18.063 --> 00:08:21.800 R a calcular a média mediana e desvio padrão. 00:08:21.900 --> 00:08:26.304 E agora fica aquele desafio de sempre busca um conjunto de valores de dados 00:08:26.304 --> 00:08:30.108 que seja da sua vida financeira, alguma outra informação que você tenha 00:08:30.175 --> 00:08:33.912 e também coloque em prática a média mediana desvio padrão que.