1 00:00:08,041 --> 00:00:09,658 Com certeza, no seu cotidiano, 2 00:00:09,658 --> 00:00:14,814 você já se deparou com a necessidade de interpretar um gráfico de barras, 3 00:00:14,814 --> 00:00:17,784 ou até mesmo ter que fazer um gráfico de barras, 4 00:00:17,784 --> 00:00:22,122 talvez no Excel ou talvez em alguma linguagem de programação. 5 00:00:22,122 --> 00:00:23,699 E não ia ser diferente aqui. 6 00:00:23,699 --> 00:00:26,326 Vocês também vão aprender a fazer com a linguagem R. 7 00:00:26,326 --> 00:00:28,168 Vem comigo que eu vou mostrar para vocês. 8 00:00:28,710 --> 00:00:30,463 Aqui eu deixei um script pré-pronto. 9 00:00:30,463 --> 00:00:35,660 Como sempre, eu tento deixar um comentário, um código comentado para vocês, 10 00:00:35,660 --> 00:00:39,216 para que facilite a interpretação. 11 00:00:39,216 --> 00:00:43,510 Na primeira parte aqui, nós iremos executar juntos, tudo bem? 12 00:00:43,510 --> 00:00:49,351 E aqui, nessa primeira parte, vem um conteúdo que vocês viram anteriormente, 13 00:00:49,351 --> 00:00:52,105 que seria esse esse "install.packages". 14 00:00:52,105 --> 00:00:53,196 O que seria isso? 15 00:00:53,196 --> 00:00:56,022 Vamos digitar juntos: install.packages. 16 00:00:56,022 --> 00:00:59,292 Lembre-se que o R da uma sugestão para vocês. 17 00:00:59,292 --> 00:01:01,928 E agora nós iremos utilizar quem? 18 00:01:01,928 --> 00:01:04,397 O ggplot2, tá? 19 00:01:04,397 --> 00:01:07,600 "Você fala: Rafa, mas eu não sei isso de cabeça." 20 00:01:07,600 --> 00:01:12,639 Tem diversos tipos de pacotes que vocês utilizam durante a programação. 21 00:01:12,639 --> 00:01:17,080 Para fazer o gráfico de barras, você tem que utilizar o ggplot2. 22 00:01:17,080 --> 00:01:21,381 Observando aqui, agora nós temos que instalar esse pacote. 23 00:01:21,381 --> 00:01:24,984 Se vocês apertarem o Enter, vocês tem que aguardar. 24 00:01:24,984 --> 00:01:29,598 Lembre-se que não é porque está vermelho que tem um problema, tudo bem? 25 00:01:29,598 --> 00:01:33,226 Se vocês tentarem interpretar o que está aqui, 26 00:01:33,226 --> 00:01:37,497 warning não é um erro, tá, é um aviso. 27 00:01:37,597 --> 00:01:41,000 Caso vocês queiram traduzir, fiquem à vontade, tudo bem? 28 00:01:41,067 --> 00:01:43,536 E perceba que foi instalado aqui com sucesso. 29 00:01:43,536 --> 00:01:49,342 Fez um download e adicionou para dentro do nosso estúdio. 30 00:01:49,442 --> 00:01:52,446 E aí você fala: "Vamos para a próxima parte agora, Rafa?" 31 00:01:52,446 --> 00:01:53,446 Vamos deixar o script pronto aqui para nós. 32 00:01:53,446 --> 00:01:56,349 Qual é essa próxima parte, Rafa? 33 00:01:56,349 --> 00:02:00,586 Sempre que estivermos lá, precisaremos chamar essa biblioteca? 34 00:02:00,653 --> 00:02:03,323 Olhe aqui esse pacote... 35 00:02:03,323 --> 00:02:04,323 Ou melhor, teclas do ggplot2 foram instaladas aqui dentro do R Studio, 36 00:02:04,323 --> 00:02:08,861 então ele está pronto para ser utilizado. 37 00:02:08,928 --> 00:02:11,764 Foi adicionado, por isso que foi feito o download, tudo bem? 38 00:02:12,665 --> 00:02:15,902 E agora nós precisamos chamar para que essa tela que nós estamos programando agora 39 00:02:17,603 --> 00:02:21,274 consiga se utilizar das funcionalidades do ggplot2. 40 00:02:21,340 --> 00:02:22,675 Vamos dar o Enter. 41 00:02:22,675 --> 00:02:24,178 Aí apareceu um erro de novo. 42 00:02:24,178 --> 00:02:25,178 Não é um erro. 43 00:02:25,178 --> 00:02:27,448 Se você achar que é um erro, não é. 44 00:02:27,448 --> 00:02:28,448 Fiquem espertos. 45 00:02:28,448 --> 00:02:31,350 Uma mensagem de alerta, tá? 46 00:02:31,350 --> 00:02:35,221 Agora que nós já temos um ambiente preparado, já instalamos o pacote do ggplot, 47 00:02:36,088 --> 00:02:38,791 nós vamos agora simular uma situação, ter uma base de dados aqui com as vendas, 48 00:02:41,828 --> 00:02:45,566 por exemplo, uma empresa de sapatos. 49 00:02:45,566 --> 00:02:46,566 E depois nós iremos projetar esses gráficos. 50 00:02:46,566 --> 00:02:49,001 Vou mostrar a minha tela para vocês aqui. 51 00:02:49,001 --> 00:02:54,307 Eu deixei um script pronto para podermos gerar uma base de dados, 52 00:02:54,373 --> 00:02:57,610 ou apertar um Control + X, que seria esse vendas aqui, 53 00:02:57,610 --> 00:03:00,947 um intervalo de venda de oito meses de uma empresa. 54 00:03:01,013 --> 00:03:04,784 no primeiro mês vender eu senti 20 R$ supondo o segundo 150, 55 00:03:04,784 --> 00:03:08,087 o terceiro teve uma queda, depois subiu novamente. 56 00:03:08,154 --> 00:03:11,824 Nem sempre as vendas apresentam uma ordem crescente ou decrescente. 57 00:03:11,857 --> 00:03:14,260 Isso aqui é um cenário normal. 58 00:03:14,260 --> 00:03:18,664 Lógico que o esperado de uma empresa são as vendas serem sempre crescentes. 59 00:03:18,731 --> 00:03:21,634 Agora vamos exibir esses dados. 60 00:03:21,634 --> 00:03:24,637 A gente vendas 61 00:03:24,737 --> 00:03:27,340 enter os dados estão aqui, armazená-los 62 00:03:27,340 --> 00:03:30,743 e aí vamos dar mais um passo para tentarmos chegar 63 00:03:30,810 --> 00:03:33,779 lá na parte de gerar o gráfico de barras, 64 00:03:33,779 --> 00:03:36,882 o script novamente está pronto de um control V. 65 00:03:36,882 --> 00:03:41,253 Eu vou recortar a parte que não nos interessa agora, que é essa outra parte aqui, 66 00:03:41,253 --> 00:03:44,657 que só está criando um dataframe para os dados de vendas. 67 00:03:47,226 --> 00:03:50,996 Eu vou apertar um Enter, vou exibir, e vou explicar para vocês 68 00:03:50,996 --> 00:03:56,535 o que tem essas cookie que tem ali naquela linha de execução que eu estava. 69 00:03:56,535 --> 00:03:58,604 Seis Executou e não nos ensinou. 70 00:03:58,604 --> 00:04:00,339 Vamos tentar entender agora. 71 00:04:00,339 --> 00:04:02,174 Talvez vocês consigam. 72 00:04:02,174 --> 00:04:05,745 Anteriormente, nós tínhamos criado vendas com os valores dos oito meses, 73 00:04:05,745 --> 00:04:07,947 só que não nomeamos você olhando. 74 00:04:07,947 --> 00:04:12,918 Você sabe que esse é o mês um, esse é o mês dois, esse é o mês três, até o mês oito. 75 00:04:12,985 --> 00:04:17,089 Só que precisamos instruir o computador, os dados referente a cada mês, 76 00:04:17,156 --> 00:04:20,192 Qual mês? 77 00:04:20,426 --> 00:04:22,361 Como fazemos isso? 78 00:04:22,361 --> 00:04:27,066 Criei aqui um dataframe que se chama "dados_vendas" 79 00:04:27,132 --> 00:04:30,035 aquela velha instrução 80 00:04:30,035 --> 00:04:34,240 ou também conhecida que foi tema de outra aula data aponta o frame. 81 00:04:34,306 --> 00:04:38,177 Nós precisamos dizer então que esse vai ser referente ao mês um. 82 00:04:38,277 --> 00:04:39,378 Esse é o mês dois. 83 00:04:39,378 --> 00:04:40,813 Como fazemos isso? 84 00:04:40,813 --> 00:04:43,816 Vamos criar uma coluna chamada "Mês" 85 00:04:43,916 --> 00:04:48,721 e pedir para nomear sequencialmente cada linha aqui, por exemplo. 86 00:04:48,721 --> 00:04:54,560 Se aqui fosse seis meses de vendas seria de 1 a 6. 87 00:04:54,660 --> 00:04:59,999 No nosso caso, não vamos manter aqui o valor oito e a outra coluna aqui. 88 00:04:59,999 --> 00:05:04,737 Eu vou manter o nome vendas, por isso que saiu esse resultado. 89 00:05:04,837 --> 00:05:07,206 E agora que o ambiente está preparado, 90 00:05:07,206 --> 00:05:11,076 nós podemos ir para a nossa última parte novamente. 91 00:05:11,076 --> 00:05:14,413 Se vocês me permitem, eu vou executar primeiro. 92 00:05:14,480 --> 00:05:16,282 Eu vou mostrar o resultado que gerou do gráfico. 93 00:05:16,282 --> 00:05:19,952 E agora eu vou explicar para vocês o que aconteceu aqui. 94 00:05:21,253 --> 00:05:26,925 "Rafa, deixo sempre um comentário para conseguir entender o que está abaixo. 95 00:05:26,992 --> 00:05:30,797 Nós não tínhamos instalado o ggplot. 96 00:05:30,797 --> 00:05:31,797 Agora nós vamos utilizar. 97 00:05:31,797 --> 00:05:36,902 Nós temos que fornecer para o ggplot a instrução de gerar o gráfico de barras, 98 00:05:36,969 --> 00:05:41,740 qual é a base de dados, e a "dados_vendas". 99 00:05:41,807 --> 00:05:43,342 Eu tenho que dar nome. 100 00:05:43,342 --> 00:05:48,313 Nós temos o eixo um, que é o eixo X, e o outro que é o Y. 101 00:05:48,380 --> 00:05:53,619 Ao eixo X, eu atribui o nome de mês um, mês dois, mês três, 102 00:05:53,619 --> 00:05:55,821 mês cota de um mês oito. 103 00:05:55,821 --> 00:05:58,957 E aqui é o volume de vendas do mês Y. 104 00:05:59,124 --> 00:06:03,729 Isso é uma coisa convencional para conseguir verificar quanto a mês. 105 00:06:03,729 --> 00:06:07,533 Quatro Quanto que eu vendia aqui no intervalo 106 00:06:07,533 --> 00:06:11,537 entre 150 e 200 mês cinco, por exemplo. 107 00:06:11,603 --> 00:06:14,373 Está fácil de ver aqui que no mês cinco foi 200. 108 00:06:14,373 --> 00:06:16,275 "Rafa, será que isso não é verdade?" 109 00:06:16,275 --> 00:06:19,611 Você pode vir aqui olhar: um, dois, três, quatro, cinco, 110 00:06:19,845 --> 00:06:24,483 ou até mesmo ir direto ao nosso data frame. 111 00:06:24,550 --> 00:06:30,055 Ele está certo como foi projetado, não teria como errar aqui no último mês. 112 00:06:30,155 --> 00:06:33,859 Então, Rafa, onde estão entre os 150 e 200? 113 00:06:33,959 --> 00:06:38,096 Tá certo, está mais próximo 200 ou 190. 114 00:06:38,197 --> 00:06:40,265 E como é feito isso? 115 00:06:40,332 --> 00:06:42,634 Não se atribui um nome, o famoso e 116 00:06:42,634 --> 00:06:46,872 dá um nome ao eixo X, ao eixo Y. 117 00:06:46,939 --> 00:06:49,207 Outra parte muito interessante é você poder atribuir a cor que você quiser 118 00:06:49,207 --> 00:06:53,245 que y data.frame. 119 00:06:53,345 --> 00:06:54,780 Só tem um velho probleminha. 120 00:06:54,780 --> 00:06:56,748 Talvez um problema seria a solução. 121 00:06:56,748 --> 00:06:58,383 A cor tem que ser inglesa, 122 00:06:58,383 --> 00:07:02,154 Se fosse instrução em português, seria azul, só que tem que colocar blue. 123 00:07:02,254 --> 00:07:06,291 Aí você vai escolher a Rafa vermelha, então você 124 00:07:06,391 --> 00:07:08,093 vai ser branco aide. 125 00:07:08,093 --> 00:07:09,895 Você vai verificar qual é a cor que você quer. 126 00:07:09,895 --> 00:07:14,032 Suas barras aqui é o estado de identificação 127 00:07:14,132 --> 00:07:16,768 que você quer que ele gere gráfico de barras 128 00:07:16,768 --> 00:07:21,373 e esteja alinhado com os números a esquerda faz sentido? 129 00:07:21,440 --> 00:07:24,543 É esse GG Taiti ou Python 130 00:07:24,576 --> 00:07:28,280 é uma em inglês, Quer dizer, para traduzir em português quer dizer título. 131 00:07:28,380 --> 00:07:32,317 É que eu venho das mensais de novo, é o nome que você quiser. 132 00:07:32,384 --> 00:07:35,320 E aqui você tem que repetir o nome dos eixos. 133 00:07:35,320 --> 00:07:37,189 O que você colocou aqui? 134 00:07:37,189 --> 00:07:39,725 A recomendação não é repetir os nomes aqui, eixo X e eixo Y. 135 00:07:43,361 --> 00:07:46,498 Alcançamos nosso objetivo, que era conseguir criar gráfico de barras com a linguagem R. 136 00:07:48,700 --> 00:07:52,237 E agora fica aquela velha dica para vocês: 137 00:07:52,304 --> 00:07:56,741 pense em dados que vocês tem, seja parte financeira, alguma coisa, 138 00:07:56,741 --> 00:08:01,513 uma projeção que você queira fazer ou que se queira fazer uma análise. 139 00:08:01,580 --> 00:08:05,083 Você pode buscar na internet algum conjunto de dados, jogue paqra dentro do R. 140 00:08:05,183 --> 00:08:07,252 A palavra é jogar mesmo. 141 00:08:07,252 --> 00:08:12,224 Traga para dentro do R, utilize o ggplot, coloque seus gráficos, mude a cor. 142 00:08:12,290 --> 00:08:16,495 Em vez de azul, coloque outra cor. 143 00:08:16,495 --> 00:08:19,332 Mude o nome dos eixos X e Y. 144 00:08:19,332 --> 00:08:20,332 E, com isso, você vai se sentindo mais confiante 145 00:08:20,332 --> 00:08:22,434 porque você conseguiu aprender a gerar gráficos.