WEBVTT 00:00:08.041 --> 00:00:09.658 Com certeza, no seu cotidiano, 00:00:09.658 --> 00:00:14.814 você já se deparou com a necessidade de interpretar um gráfico de barras, 00:00:14.814 --> 00:00:17.784 ou até mesmo ter que fazer um gráfico de barras, 00:00:17.784 --> 00:00:22.122 talvez no Excel ou talvez em alguma linguagem de programação. 00:00:22.122 --> 00:00:23.699 E não ia ser diferente aqui. 00:00:23.699 --> 00:00:26.326 Vocês também vão aprender a fazer com a linguagem R. 00:00:26.326 --> 00:00:28.168 Vem comigo que eu vou mostrar para vocês. 00:00:28.710 --> 00:00:30.463 Aqui eu deixei um script pré-pronto. 00:00:30.463 --> 00:00:35.660 Como sempre, eu tento deixar um comentário, um código comentado para vocês, 00:00:35.660 --> 00:00:39.216 para que facilite a interpretação. 00:00:39.216 --> 00:00:43.510 Na primeira parte aqui, nós iremos executar juntos, tudo bem? 00:00:43.510 --> 00:00:49.351 E aqui, nessa primeira parte, vem um conteúdo que vocês viram anteriormente, 00:00:49.351 --> 00:00:52.105 que seria esse "install.packages". 00:00:52.105 --> 00:00:53.196 O que seria isso? 00:00:53.196 --> 00:00:56.022 Vamos digitar juntos: install.packages. 00:00:56.022 --> 00:00:59.292 Lembre-se que o R dá uma sugestão para vocês. 00:00:59.292 --> 00:01:01.928 E agora nós iremos utilizar quem? 00:01:01.928 --> 00:01:04.397 O ggplot2, tá? 00:01:04.397 --> 00:01:07.600 Você fala: "Rafa, mas eu não sei isso de cabeça". 00:01:07.600 --> 00:01:12.639 Tem diversos tipos de pacotes que vocês utilizam durante a programação. 00:01:12.639 --> 00:01:17.080 Para fazer o gráfico de barras, você tem que utilizar o "ggplot2". 00:01:17.080 --> 00:01:21.381 Observando aqui, agora nós temos que instalar esse pacote. 00:01:21.381 --> 00:01:24.984 Se vocês apertarem o Enter, vocês têm que aguardar. 00:01:24.984 --> 00:01:29.598 Lembre-se que não é porque está vermelho que tem um problema, tudo bem? 00:01:29.598 --> 00:01:33.226 Se vocês tentarem interpretar o que está aqui, 00:01:33.226 --> 00:01:37.597 warning não é um erro, tá, é um aviso. 00:01:37.597 --> 00:01:41.067 Caso vocês queiram traduzir, fiquem à vontade, tudo bem? 00:01:41.067 --> 00:01:44.516 E perceba que foi instalado com sucesso aqui. 00:01:44.516 --> 00:01:49.342 Fez um download e adicionou para dentro do nosso R Studio. 00:01:49.342 --> 00:01:51.726 E aí você fala: "Vamos para a próxima parte agora, Rafa?" 00:01:51.726 --> 00:01:52.337 Vamos. 00:01:52.337 --> 00:01:54.826 Deixei o script pré-pronto aqui para nós. 00:01:54.826 --> 00:01:56.709 "Qual é essa próxima parte, Rafa?" 00:01:56.709 --> 00:02:00.653 Sempre que instalamos, precisamos chamar essa biblioteca. 00:02:00.653 --> 00:02:04.193 Olhe aqui, esse pacote, essa biblioteca, o ggplot2, 00:02:04.193 --> 00:02:06.503 foi instalado aqui dentro do R Studio. 00:02:06.503 --> 00:02:08.928 Então ele está pronto para ser utilizado. 00:02:08.928 --> 00:02:12.665 Foi adicionado, por isso que foi feito o download, tudo bem? 00:02:12.665 --> 00:02:17.143 E agora nós precisamos chamar para que essa tela que nós estamos programando agora 00:02:17.143 --> 00:02:21.340 consiga utilizar as funcionalidades do ggplot2. 00:02:21.340 --> 00:02:22.675 Vamos dar o Enter. 00:02:22.675 --> 00:02:23.888 Aí apareceu um erro. 00:02:23.888 --> 00:02:25.178 De novo, não é um erro. 00:02:25.178 --> 00:02:27.448 Se você achar que é um erro, não é. 00:02:27.448 --> 00:02:28.448 Fiquem espertos. 00:02:28.448 --> 00:02:31.166 É uma mensagem de alerta, tá? 00:02:31.166 --> 00:02:36.088 Agora que nós já temos um ambiente preparado, já instalamos o pacote do ggplot, 00:02:36.088 --> 00:02:41.828 nós vamos agora simular uma situação, ter uma base de dados aqui com as vendas, 00:02:41.828 --> 00:02:43.716 como por exemplo, uma empresa de sapatos, 00:02:43.716 --> 00:02:46.566 e depois nós iremos projetar esses gráficos. 00:02:46.566 --> 00:02:48.731 Eu vou mostrar a minha tela para vocês. 00:02:48.731 --> 00:02:54.373 Eu deixei um script pronto aqui para podermos gerar uma base de dados. 00:02:54.373 --> 00:02:56.020 Eu vou apertar o Control + X. 00:02:56.020 --> 00:02:57.310 O que seria esse vendas? 00:02:57.310 --> 00:03:01.013 Aqui é um intervalo de vendas de oito meses de uma empresa. 00:03:01.013 --> 00:03:04.784 No primeiro mês vendeu 120 reais, no segundo 150, 00:03:04.784 --> 00:03:08.154 no terceiro teve uma queda, depois subiu novamente. 00:03:08.154 --> 00:03:11.857 Nem sempre as vendas apresentam uma ordem crescente ou decrescente. 00:03:11.857 --> 00:03:14.260 Isso aqui é um cenário normal. 00:03:14.260 --> 00:03:18.731 Lógico que o esperado de uma empresa são as vendas serem sempre crescentes, né? 00:03:18.731 --> 00:03:21.634 Agora vamos exibir esses dados... 00:03:21.634 --> 00:03:23.558 print(vendas)... 00:03:24.737 --> 00:03:25.490 Enter. 00:03:25.490 --> 00:03:27.340 Os dados estão aqui armazenados. 00:03:27.340 --> 00:03:30.810 E aí vamos andar mais um passo para tentarmos chegar 00:03:30.810 --> 00:03:33.779 na parte de gerar o gráfico de barras. 00:03:33.779 --> 00:03:35.342 O script está pré-pronto novamente. 00:03:35.342 --> 00:03:36.882 Eu dei um Control + V. 00:03:36.882 --> 00:03:40.253 Eu vou recortar agora a parte que não nos interessa. 00:03:40.253 --> 00:03:42.093 O que é essa outra parte aqui? 00:03:42.093 --> 00:03:47.226 Olhe, "Criando um dataframe para os dados de vendas". 00:03:47.226 --> 00:03:50.996 Eu vou apertar um Enter, vou exibir, e vou explicar para vocês 00:03:50.996 --> 00:03:55.328 o que tem naquela linha de execução. 00:03:56.255 --> 00:03:58.604 "Rafa, você executou e não nos ensinou." 00:03:58.604 --> 00:03:59.989 Vamos tentar entender? 00:03:59.989 --> 00:04:02.174 Talvez agora vocês consigam. 00:04:02.174 --> 00:04:05.745 Anteriormente, nós tínhamos criado vendas com os valores dos oito meses, 00:04:05.745 --> 00:04:07.317 só que não nomeamos. 00:04:07.317 --> 00:04:10.325 Olhando, você sabe que esse é do mês um, esse é do mês dois, 00:04:10.325 --> 00:04:12.985 esse é do mês três, até o do mês oito. 00:04:12.985 --> 00:04:17.089 Só que precisamos dizer, instruir o computador, 00:04:17.089 --> 00:04:20.426 a que mês se refere cada dado. 00:04:20.426 --> 00:04:22.361 Como fazemos isso? 00:04:22.361 --> 00:04:27.132 Criei aqui um dataframe que se chama "dados_vendas". 00:04:27.132 --> 00:04:30.745 A instrução, aquela conhecida value_instrucao, 00:04:30.745 --> 00:04:34.306 que foi tema de outra aula, "data.frame". 00:04:34.306 --> 00:04:39.378 Nós precisamos dizer então que esse vai ser referente ao mês um, esse é o mês dois. 00:04:39.378 --> 00:04:40.813 Como fazemos isso? 00:04:40.813 --> 00:04:43.916 Vamos criar uma coluna chamada "Mês", 00:04:43.916 --> 00:04:47.871 e pedir para nomear sequencialmente cada linha. 00:04:47.871 --> 00:04:54.660 Se aqui fosse seis meses de vendas seria de 1 a 6. 00:04:54.660 --> 00:04:56.039 No nosso caso, não, né? 00:04:56.039 --> 00:04:58.609 Vamos manter aqui o valor oito. 00:04:58.609 --> 00:05:02.317 E a outra coluna aqui, eu vou manter o nome vendas. 00:05:02.317 --> 00:05:04.837 Por isso que saiu esse resultado. 00:05:04.837 --> 00:05:10.456 E agora que o ambiente está preparado, nós podemos ir para a nossa última parte. 00:05:10.456 --> 00:05:13.523 Novamente, se vocês me permitem, eu vou executar primeiro. 00:05:14.480 --> 00:05:17.372 Eu vou mostrar o resultado que gerou do gráfico, 00:05:17.372 --> 00:05:19.952 e agora eu vou explicar para vocês, tá? 00:05:19.952 --> 00:05:22.033 "O que aconteceu aqui, Rafa?" 00:05:22.033 --> 00:05:26.992 Eu sempre deixo um comentário para conseguir entender o que está abaixo. 00:05:26.992 --> 00:05:30.127 Nós não tínhamos instalado o ggplot? 00:05:30.127 --> 00:05:31.797 Agora nós vamos utilizar. 00:05:31.797 --> 00:05:34.419 Nós temos que fornecer a base de dados para o ggplot, 00:05:34.419 --> 00:05:38.319 a instrução de gerar o gráfico de barras. 00:05:38.319 --> 00:05:40.390 É a "dados_vendas". 00:05:40.390 --> 00:05:43.342 Forneci, e eu tenho que dar nome. 00:05:43.342 --> 00:05:48.380 Nós temos um eixo, que é o eixo X, e o outro, que é o Y. 00:05:48.380 --> 00:05:53.619 Ao eixo X, eu atribuí o nome de mês, mês um, mês dois, mês três, 00:05:53.619 --> 00:05:55.821 mês quatro, até o mês oito. 00:05:55.821 --> 00:05:59.124 E aqui é o volume de vendas, mês Y. 00:05:59.124 --> 00:06:03.039 Isso é uma coisa convencional para conseguir verificar quanto... 00:06:03.039 --> 00:06:05.743 Mês quatro, quanto eu vendi? 00:06:05.743 --> 00:06:09.623 Está aqui, olhe, num intervalo entre 150 e 200. 00:06:09.623 --> 00:06:11.603 Mês cinco, por exemplo... 00:06:11.603 --> 00:06:14.373 Está fácil de ver aqui que no mês cinco foi 200. 00:06:14.373 --> 00:06:16.275 "Rafa, será que isso é verdade?" 00:06:16.275 --> 00:06:21.645 Você pode vir aqui e olhar: um, dois, três, quatro, cinco, 00:06:21.645 --> 00:06:24.550 ou até mesmo ir direto ao nosso dataframe. 00:06:24.550 --> 00:06:26.245 Então está certo como foi projetado. 00:06:26.245 --> 00:06:27.925 Não teria como errar. 00:06:27.925 --> 00:06:33.859 Aqui no último mês está entre os 150 e 200. 00:06:33.859 --> 00:06:38.197 Está certo, olhe, está mais próximo do 200, olhe, 190. 00:06:38.197 --> 00:06:39.212 E como é feito isso? 00:06:39.212 --> 00:06:42.634 Você atribui um nome, o famoso "aes". 00:06:42.634 --> 00:06:46.939 Dá um nome ao eixo X, ao eixo Y. 00:06:46.939 --> 00:06:50.607 Outra parte muito interessante é você poder atribuir 00:06:50.607 --> 00:06:53.345 a cor que você quer no seu dataframe. 00:06:53.345 --> 00:06:54.780 Só tem um velho probleminha. 00:06:54.780 --> 00:06:56.748 Talvez não um problema, mas uma solução. 00:06:56.748 --> 00:06:58.383 A cor tem que ser em inglês, 00:06:58.383 --> 00:07:00.634 porque se fosse instrução em português seria azul. 00:07:00.634 --> 00:07:02.254 Só que tem que colocar "blue". 00:07:02.254 --> 00:07:05.821 Aí se você escolher vermelha, vai ser "red", 00:07:05.821 --> 00:07:08.093 se for branca, vai ser "white". 00:07:08.093 --> 00:07:11.115 Você vai verificar qual é a cor que você quer as suas barras. 00:07:11.115 --> 00:07:14.132 Aqui é o estado de identificação 00:07:14.132 --> 00:07:16.768 que você quer que ele gere gráfico de barras 00:07:16.768 --> 00:07:19.953 e que esteja alinhado com os números à esquerda. 00:07:19.953 --> 00:07:21.440 Isso faz sentido. 00:07:21.440 --> 00:07:23.986 E esse "ggtitle"? 00:07:23.986 --> 00:07:28.380 "Title", traduzindo do inglês para o português, quer dizer "título". 00:07:28.380 --> 00:07:29.964 E aqui, "Vendas Mensais". 00:07:29.964 --> 00:07:32.384 De novo, é o nome que você quiser. 00:07:32.384 --> 00:07:35.239 E aqui você tem que repetir o nome dos eixos. 00:07:35.239 --> 00:07:37.259 O que você colocou aqui, 00:07:37.259 --> 00:07:43.272 a recomendação é repetir os nomes aqui, eixo X e eixo Y. 00:07:43.272 --> 00:07:48.700 Alcançamos nosso objetivo, que era conseguir criar gráfico de barras com a linguagem R. 00:07:48.700 --> 00:07:52.304 E agora fica aquela velha dica para vocês: 00:07:52.304 --> 00:07:56.741 pensem em dados que vocês tem da parte financeira, 00:07:56.741 --> 00:08:01.580 uma projeção que você queira fazer, ou uma análise que você queira fazer, 00:08:01.580 --> 00:08:05.024 ou você pode buscar na internet algum conjunto de dados. 00:08:05.024 --> 00:08:06.333 Jogue para dentro do R. 00:08:06.333 --> 00:08:07.252 A palavra é jogar mesmo. 00:08:07.252 --> 00:08:10.690 Traga para dentro do R, utilize o ggplot, 00:08:10.690 --> 00:08:12.880 coloque os seus gráficos, mude a cor. 00:08:12.880 --> 00:08:15.125 Em vez de azul, coloque outra cor. 00:08:15.125 --> 00:08:17.482 Mude o nome dos eixos X e Y. 00:08:17.482 --> 00:08:19.932 E, com isso, você vai se sentir mais confiante 00:08:19.932 --> 00:08:22.304 porque você conseguiu aprender a gerar gráficos.