1 00:00:08,007 --> 00:00:08,441 Você já teve a 2 00:00:08,441 --> 00:00:11,444 necessidade de fazer a sua média salarial, 3 00:00:11,578 --> 00:00:15,949 calcular a sua média das suas notas ou qualquer outro tipo de média? 4 00:00:16,015 --> 00:00:18,518 E é isso então que hoje eu vou ensinar para vocês. 5 00:00:18,518 --> 00:00:21,521 Mas não pense que será no Excel ou em uma calculadora. 6 00:00:21,688 --> 00:00:24,691 Nós iremos fazer isso dentro da linguagem aqui. 7 00:00:24,891 --> 00:00:27,660 Vem comigo que eu vou mostrar para vocês como fazer isso. 8 00:00:27,660 --> 00:00:31,931 Aqui eu já deixei para vocês um script pronto e você fala Porra! 9 00:00:31,998 --> 00:00:33,233 Mas o que nós iremos fazer? 10 00:00:33,233 --> 00:00:35,702 Só executar a gente só executar. 11 00:00:35,702 --> 00:00:38,371 Aqui estão os valores, aqui estão os resultados. 12 00:00:38,371 --> 00:00:41,374 Com certeza esse não é um objetivo com vocês. 13 00:00:41,474 --> 00:00:42,342 O script está aqui. 14 00:00:42,342 --> 00:00:45,945 Toda vez que você vê essa tag e o comentário que ele está 15 00:00:46,079 --> 00:00:50,850 ignorando na execução e o restante aqui, eu estou pedindo para lhe fazer algo. 16 00:00:50,917 --> 00:00:53,920 Uma execução é uma atribuição de um valor ou mostrar em tela. 17 00:00:54,187 --> 00:00:55,021 Então vamos pegar aqui 18 00:00:55,021 --> 00:00:58,858 por partes para a gente não precisar ir executando junto com computador. 19 00:00:58,958 --> 00:01:01,861 Tudo bem se a gente pegar aqui esse primeiro 20 00:01:01,861 --> 00:01:06,165 dados de vendas mensais temos aqui ao a variável vendas. 21 00:01:06,232 --> 00:01:08,902 Nós estamos atribuindo oito 22 00:01:08,902 --> 00:01:11,704 conjunto de valores aqui para dentro de vendas. 23 00:01:11,704 --> 00:01:12,639 Vamos supor. 24 00:01:12,639 --> 00:01:16,009 Mês um mês dois mês três mês quatro, 25 00:01:16,109 --> 00:01:19,112 cinco, seis sete mês oito. 26 00:01:19,312 --> 00:01:22,248 Então nós temos aqui as vendas de oito meses. 27 00:01:22,248 --> 00:01:24,584 Atribuímos. E aqui nós mostramos. 28 00:01:24,584 --> 00:01:28,187 Quando fazemos isso, aparece esses valores. 29 00:01:28,288 --> 00:01:28,855 Legal, Rafa. 30 00:01:28,855 --> 00:01:31,924 Então nós temos um conjunto de valores de vendas aí. 31 00:01:31,924 --> 00:01:33,526 Agora, o que nós podemos fazer? 32 00:01:33,526 --> 00:01:36,829 Pegar esses oito valores e achar a média. 33 00:01:36,929 --> 00:01:40,900 Talvez de cabeça você já consiga imaginar como será o computador. 34 00:01:40,900 --> 00:01:41,634 Vai fazer o quê? 35 00:01:41,634 --> 00:01:44,170 Pegar os oito valores, somar todos. 36 00:01:44,170 --> 00:01:45,805 Esse valores e dividir por oito. 37 00:01:45,805 --> 00:01:47,306 Então acharemos a média. 38 00:01:47,306 --> 00:01:49,409 Vamos ver como fazer isso com Warren. 39 00:01:49,409 --> 00:01:52,812 Então, aqui eu deixei para vocês 40 00:01:52,879 --> 00:01:55,081 um script pré pronto, mas vamos rodar junto. 41 00:01:55,081 --> 00:01:56,015 O que seria isso? 42 00:01:56,015 --> 00:01:58,184 Tem uma variável chamada vendas. 43 00:01:58,184 --> 00:02:01,754 Essa variável Nós temos um conjunto de valores. 44 00:02:01,954 --> 00:02:04,490 Vamos supor que nós temos oito meses. 45 00:02:04,490 --> 00:02:08,828 Precisamos representar então mês um mês, dois mês três mês quatro 46 00:02:08,828 --> 00:02:12,799 mês cinco, seis, sete mês oito. 47 00:02:12,899 --> 00:02:15,902 Então esses são os valores das vendas de oito meses. 48 00:02:16,035 --> 00:02:18,871 Se eu apertar o enter, eu atribuí esses 49 00:02:18,871 --> 00:02:21,874 oito valores à variável vendas e agora eu vou 50 00:02:22,074 --> 00:02:27,180 apertar, dar a instrução print, o nome da variável vendas 51 00:02:27,280 --> 00:02:30,583 e nós vamos conseguir visualizar os oito valores. 52 00:02:30,650 --> 00:02:33,519 Agora nós vamos para o nosso primeiro objetivo 53 00:02:33,519 --> 00:02:36,989 calcular a média desses oito valores na sua cabeça. 54 00:02:37,089 --> 00:02:39,358 Você já deve ter feito uma pega. 55 00:02:39,358 --> 00:02:44,130 Abrisse o Excel, a sua calculadora somou os oito valores e dividiu por oito. 56 00:02:44,230 --> 00:02:47,867 Sim, tá certo que você fez, mas vamos aprender a fazer isso com R. 57 00:02:47,934 --> 00:02:50,937 Não é difícil, é bem simples. Vem comigo. 58 00:02:51,070 --> 00:02:53,139 Agora, o que nós precisamos fazer? 59 00:02:53,139 --> 00:02:55,942 Nós precisamos criar uma nova variável. 60 00:02:55,942 --> 00:02:59,779 Vamos chamar ela de média vendas, ok? 61 00:02:59,812 --> 00:03:03,082 Inclusive eu estou usando a mesma coisa que está no script aqui tá? 62 00:03:03,115 --> 00:03:04,884 Pra gente não precisar ficar mudando muito, 63 00:03:04,884 --> 00:03:09,055 posso dar um nome para outra de outra variável, pode ficar a vontade. 64 00:03:09,155 --> 00:03:12,158 Essa instrução que calcula a média 65 00:03:12,224 --> 00:03:16,495 é agora quais com intervalo de valores está onde está dentro de vendas. 66 00:03:16,596 --> 00:03:20,199 Então eu tô pedindo assim pro RR, pega todos os valores 67 00:03:20,199 --> 00:03:25,638 que estão dentro de vendas, calcula média e através desses instrução 68 00:03:25,705 --> 00:03:29,141 e atribuiu ao valor da média dentro dessa variável. 69 00:03:29,208 --> 00:03:32,378 Vamos apertar o enter agora a gente só visualizar 70 00:03:32,578 --> 00:03:35,648 o que foi armazenado dentro dessa variável. 71 00:03:35,648 --> 00:03:38,651 Vamos ver qual é a média, então só apertar o enter. 72 00:03:38,884 --> 00:03:44,890 Então a média desses oito valores é 162,5. 73 00:03:44,957 --> 00:03:47,193 Primeiro, o objetivo foi alcançado. 74 00:03:47,193 --> 00:03:49,395 Vamos evoluir mais um pouco agora. 75 00:03:49,395 --> 00:03:52,264 Agora nós vamos aprender a calcular 76 00:03:52,331 --> 00:03:53,532 a mediana. 77 00:03:53,532 --> 00:03:58,237 Eu deixei aqui voltando pra tela para que vocês um comentário. 78 00:03:58,304 --> 00:04:01,307 Você pode escutar o que eu vou falar e anotar, 79 00:04:01,507 --> 00:04:04,176 ou também você pode olhar os materiais de estudos 80 00:04:04,176 --> 00:04:08,380 ou também está aqui um breve resumo do que é a mediana e a mediana. 81 00:04:08,614 --> 00:04:11,617 Puxando aqui para a parte da estatística, nós estamos mexendo. 82 00:04:11,750 --> 00:04:14,286 É uma medida estatística que representa 83 00:04:14,286 --> 00:04:17,289 o valor central em um conjunto de dados. 84 00:04:17,289 --> 00:04:18,357 Qual é o conjunto de dados? 85 00:04:18,357 --> 00:04:20,292 Nosso Rafa é esse conjunto. 86 00:04:20,292 --> 00:04:22,495 Vamos continuar trabalhando neles para facilitar. 87 00:04:22,495 --> 00:04:24,930 Tudo bem, O Rafa tem um outro conjunto de dados. 88 00:04:24,930 --> 00:04:30,569 Se aplica então e a média central desse conjunto de dados 89 00:04:30,669 --> 00:04:34,006 organizados de forma crescente ou decrescente? 90 00:04:34,073 --> 00:04:37,376 Nesse caso, aqui a gente não tem, não está organizado. 91 00:04:37,510 --> 00:04:38,844 Poxa, Rafa, ele não está. 92 00:04:38,844 --> 00:04:41,080 Vamos ver como é que faz isso. Então ele vai. 93 00:04:41,080 --> 00:04:42,615 O web vai nos ajudar, 94 00:04:42,615 --> 00:04:45,317 então se vocês verificarem, nós temos esse script 95 00:04:45,317 --> 00:04:48,120 pronto e os comentários, mas vamos fazer juntos. 96 00:04:48,120 --> 00:04:48,988 Tudo bem? 97 00:04:48,988 --> 00:04:50,155 Então nós vamos fazer o que? 98 00:04:50,155 --> 00:04:52,658 Como anteriormente, nós vamos criar uma variável, 99 00:04:52,658 --> 00:04:56,528 nós vamos chamar média vendas, nós vamos chamar a mediana 100 00:04:56,595 --> 00:05:00,699 vendas sinal de menor sinal de atribuição. 101 00:05:00,766 --> 00:05:03,969 E agora, o que a gente precisa fazer anteriormente 102 00:05:04,069 --> 00:05:07,806 para calcular a média era assim, agora a média. 103 00:05:07,873 --> 00:05:10,809 Agora nós precisamos calcular a mediana. 104 00:05:10,809 --> 00:05:12,478 Essa outra instrução. 105 00:05:12,478 --> 00:05:13,779 Rafa, a mediana. 106 00:05:13,779 --> 00:05:17,149 De qual conjunto de dados nós vamos selecionar? 107 00:05:17,216 --> 00:05:19,885 Esse conjunto de dados está armazenado aonde? 108 00:05:19,885 --> 00:05:21,687 Dentro de vendas? 109 00:05:21,787 --> 00:05:22,321 Então nós vamos 110 00:05:22,321 --> 00:05:25,324 digitar aqui vendas e apertar o enter. 111 00:05:25,457 --> 00:05:26,925 Aí você fala será que funcionou? 112 00:05:26,925 --> 00:05:27,593 Se não deu um erro? 113 00:05:27,593 --> 00:05:30,596 A princípio sim, mas nós precisamos visualizar 114 00:05:30,663 --> 00:05:35,134 qual é a variável que guardo que armazena o valor da mediana. 115 00:05:35,267 --> 00:05:37,770 Está aqui Control c control v. 116 00:05:37,770 --> 00:05:39,571 Ah, não Rafa, eu gosto de digitar. 117 00:05:39,571 --> 00:05:43,609 Eu tenho uma dica que às vezes é bom você copiar o nome da variável, 118 00:05:43,609 --> 00:05:47,646 mas se você quiser por risco seu digitar, lembre também da facilidade do R 119 00:05:47,646 --> 00:05:48,614 que ele aparece. 120 00:05:48,614 --> 00:05:52,718 Me parece que tem uma variável com esse nome a essa mesmo que eu quero, 121 00:05:52,785 --> 00:05:54,186 vou apertar o enter. 122 00:05:54,186 --> 00:05:57,156 Então, o que a gente acabou de descobrir aqui? 123 00:05:57,156 --> 00:05:57,689 A média. 124 00:05:57,689 --> 00:06:00,692 Anteriormente descobrimos que a média desses oito números 125 00:06:00,859 --> 00:06:03,862 é 107, tem 62,5. 126 00:06:04,062 --> 00:06:08,801 É a mediana para esses oito números, é um meio cinco legal. 127 00:06:08,801 --> 00:06:10,903 Calçamos nosso segundo objetivo. 128 00:06:10,903 --> 00:06:14,907 Nosso terceiro e último objetivo para agora é calcular o desvio padrão 129 00:06:14,940 --> 00:06:19,211 nesse intervalo desses oito números das vendas, vamos verificar. 130 00:06:19,278 --> 00:06:21,046 Vem comigo na minha tela aqui. 131 00:06:21,046 --> 00:06:26,485 Então, como anteriormente, eu deixei aqui um script pré pronto, recomendo novamente 132 00:06:26,652 --> 00:06:30,589 vocês depois pausar esse vídeo, olhar esses comentários 133 00:06:30,689 --> 00:06:33,325 e vamos relembrar o que que é o desvio padrão. 134 00:06:33,325 --> 00:06:37,863 Ele indica a medida de dispersão de um conjunto de dados 135 00:06:37,963 --> 00:06:40,432 em relação a sua média aritmética. 136 00:06:40,432 --> 00:06:43,035 Então Rafa, como assim um conjunto de dados? 137 00:06:43,035 --> 00:06:43,869 O conjunto de dados? 138 00:06:43,869 --> 00:06:47,005 É isso que a gente tem nas vendas os oito meses em relação 139 00:06:47,005 --> 00:06:51,643 à sua média métrica, ele vai analisar e fazer 140 00:06:51,710 --> 00:06:53,378 um vínculo entre a média 141 00:06:53,378 --> 00:06:57,716 aritmética e esse conjunto de dados, que são esses outros valores. 142 00:06:57,816 --> 00:06:59,918 Como que faz isso de novo? É simples. 143 00:06:59,918 --> 00:07:00,786 Vamos lá. 144 00:07:00,786 --> 00:07:04,423 Eu deixei o script aqui, o resultado está aqui, mas vamos fazer junto. 145 00:07:04,423 --> 00:07:07,592 É legal a gente programar junto com vocês aqui 146 00:07:07,626 --> 00:07:10,929 o desvio underline, padrão, 147 00:07:10,996 --> 00:07:14,299 padrão, underline, vendas. 148 00:07:14,399 --> 00:07:15,233 Que que é isso Rafa? 149 00:07:15,233 --> 00:07:17,869 Eu preciso criar uma variável como anteriormente, 150 00:07:17,869 --> 00:07:21,440 que armazene o valor do desvio padrão desse conjunto de dados. 151 00:07:21,540 --> 00:07:24,743 Esse daqui, essa, daqui, a variável você pode colocar outro nome. 152 00:07:24,743 --> 00:07:28,847 Tudo bem, o nome geralmente a gente deixa para facilitar a compreensão. 153 00:07:28,847 --> 00:07:32,718 O que ela está armazenando é Rafa, como que a instrução 154 00:07:32,784 --> 00:07:37,389 que calcula o desvio padrão para calcular o desvio padrão, a instrução 155 00:07:37,389 --> 00:07:43,161 SD abre parênteses Qual que é o conjunto onde está armazenado o conjunto de dados? 156 00:07:43,328 --> 00:07:46,665 O conjunto de dados está armazenado dentro de vendas? 157 00:07:46,732 --> 00:07:50,735 Então aqui eu coloco o nome do meu conjunto de dados. 158 00:07:50,802 --> 00:07:52,304 E agora a gente só visualizar. 159 00:07:52,304 --> 00:07:55,240 Vamos ver qual que é o valor do desvio padrão. 160 00:07:55,240 --> 00:08:00,445 Você pode copiar, colar ou você digita o começo da variável, o R fala 161 00:08:00,579 --> 00:08:04,216 Eu acho que é isso mesmo, apertou enter. 162 00:08:04,282 --> 00:08:07,719 Então o valor do meu desvio padrão para esse conjunto de dados, 163 00:08:07,719 --> 00:08:13,625 esses oito meses das vendas é 28,15772. 164 00:08:13,692 --> 00:08:14,259 Ótimo! 165 00:08:14,259 --> 00:08:18,063 Conseguimos alcançar nosso objetivo, aprendemos com a linguagem 166 00:08:18,063 --> 00:08:21,800 R a calcular a média mediana e desvio padrão. 167 00:08:21,900 --> 00:08:26,304 E agora fica aquele desafio de sempre busca um conjunto de valores de dados 168 00:08:26,304 --> 00:08:30,108 que seja da sua vida financeira, alguma outra informação que você tenha 169 00:08:30,175 --> 00:08:33,912 e também coloque em prática a média mediana desvio padrão que.