WEBVTT 00:00:08.041 --> 00:00:08.808 Com certeza, no seu cotidiano, 00:00:08.808 --> 00:00:11.811 você já se deparou com a necessidade de interpretar um gráfico de barras, 00:00:14.814 --> 00:00:17.784 ou até mesmo ter que fazer um gráfico de barras, 00:00:17.784 --> 00:00:22.055 talvez no Excel ou talvez em alguma linguagem de programação. 00:00:22.122 --> 00:00:23.189 E não ia ser diferente. 00:00:23.189 --> 00:00:26.192 Aqui vocês vão também vão aprender a fazer com a linguagem R. 00:00:26.326 --> 00:00:28.828 Vem comigo que eu vou mostrar para vocês. 00:00:28.828 --> 00:00:30.463 Aqui eu deixei o script pré-pronto. 00:00:30.463 --> 00:00:33.800 Como sempre, eu tento deixar um comentário e um código comentado para vocês 00:00:33.900 --> 00:00:39.506 para que facilite a interpretação legal aqui. 00:00:39.506 --> 00:00:43.443 Na primeira parte, nós iremos executar juntos, tudo bem? 00:00:43.510 --> 00:00:48.081 E aqui, nessa primeira parte, vem o conteúdo que vocês viram anteriormente, 00:00:48.081 --> 00:00:52.118 que seria esse esse tal ponto. 00:00:52.185 --> 00:00:52.986 O que seria isso? 00:00:52.986 --> 00:00:55.221 "Rafa, vamos digitar juntos install, lembra?" 00:00:55.221 --> 00:00:56.022 Ponto. Pede. 00:00:56.022 --> 00:00:59.292 Lembre-se que o R da uma sugestão para vocês. 00:00:59.359 --> 00:01:01.928 E agora nós iremos utilizar quem? 00:01:01.928 --> 00:01:04.397 O ggplot2, tá? 00:01:04.397 --> 00:01:07.400 "Você falou, Rafa, mas isso não saiu de cabeça." 00:01:07.600 --> 00:01:12.538 Tem diversos tipos de pacotes que vocês utilizam durante a programação 00:01:12.639 --> 00:01:15.576 para fazer o gráfico de barras. 00:01:15.576 --> 00:01:16.576 Você tem que utilizar o ggplot2. 00:01:16.576 --> 00:01:21.314 Observando aqui, agora nós temos que instalar esse pacote. 00:01:21.381 --> 00:01:24.851 Se vocês apertaram Enter, vocês tem que aguardar, não é? 00:01:24.984 --> 00:01:28.321 Lembre-se que não é porque está com vermelho que tem que ter um problema. 00:01:28.388 --> 00:01:33.126 Tudo bem se vocês tentarem interpretar o que está aqui. 00:01:33.226 --> 00:01:37.497 Na parte Warning, não é um erro, é um aviso. 00:01:37.597 --> 00:01:41.000 Caso vocês queiram traduzir, fiquem à vontade, tudo bem? 00:01:41.067 --> 00:01:43.536 E perceba que foi instalado aqui com sucesso. 00:01:43.536 --> 00:01:49.342 Fez um download e adicionou para dentro do nosso estúdio. 00:01:49.442 --> 00:01:52.446 E aí você fala: "Vamos para a próxima parte agora, Rafa?" 00:01:52.446 --> 00:01:53.446 Vamos deixar o script pronto aqui para nós. 00:01:53.446 --> 00:01:56.349 Qual é essa próxima parte, Rafa? 00:01:56.349 --> 00:02:00.586 Sempre que estivermos lá, precisaremos chamar essa biblioteca? 00:02:00.653 --> 00:02:03.323 Olhe aqui esse pacote... 00:02:03.323 --> 00:02:04.323 Ou melhor, teclas do ggplot2 foram instaladas aqui dentro do R Studio, NOTE Paragraph 00:02:04.323 --> 00:02:08.861 então ele está pronto para ser utilizado. 00:02:08.928 --> 00:02:11.764 Foi adicionado, por isso que foi feito o download, tudo bem? 00:02:12.665 --> 00:02:15.902 E agora nós precisamos chamar para que essa tela que nós estamos programando agora 00:02:17.603 --> 00:02:21.274 consiga se utilizar das funcionalidades do ggplot2. 00:02:21.340 --> 00:02:22.675 Vamos dar o Enter. 00:02:22.675 --> 00:02:24.178 Aí apareceu um erro de novo. 00:02:24.178 --> 00:02:25.178 Não é um erro. 00:02:25.178 --> 00:02:27.448 Se você achar que é um erro, não é. 00:02:27.448 --> 00:02:28.448 Fiquem espertos. 00:02:28.448 --> 00:02:31.350 Uma mensagem de alerta, tá? 00:02:31.350 --> 00:02:35.221 Agora que nós já temos um ambiente preparado, já instalamos o pacote do ggplot, 00:02:36.088 --> 00:02:38.791 nós vamos agora simular uma situação, ter uma base de dados aqui com as vendas, 00:02:41.828 --> 00:02:45.566 por exemplo, uma empresa de sapatos. 00:02:45.566 --> 00:02:46.566 E depois nós iremos projetar esses gráficos. 00:02:46.566 --> 00:02:49.001 Vou mostrar a minha tela para vocês aqui. 00:02:49.001 --> 00:02:54.307 Eu deixei um script pronto para a gente para podermos aqui gerar uma base de dados 00:02:54.373 --> 00:02:57.610 ou apertar um control X que seria esse vendas aqui 00:02:57.610 --> 00:03:00.947 um intervalo de venda de oito meses de uma empresa 00:03:01.013 --> 00:03:04.784 no primeiro mês vender eu senti 20 R$ supondo o segundo 150, 00:03:04.784 --> 00:03:08.087 o terceiro teve uma queda, depois subiu novamente. 00:03:08.154 --> 00:03:11.824 Nem sempre as vendas apresentam o que uma ordem crescente ou decrescente. 00:03:11.857 --> 00:03:14.260 Isso daqui é um cenário de alguma maneira normal. 00:03:14.260 --> 00:03:18.664 Lógico que o esperado é uma empresa sempre ser crescente as vendas. 00:03:18.731 --> 00:03:21.634 Agora vamos exibir esses dados. 00:03:21.634 --> 00:03:24.637 A gente vendas 00:03:24.737 --> 00:03:27.340 enter os dados estão aqui, armazená los 00:03:27.340 --> 00:03:30.743 e aí vamos dar mais um passo para a gente tentar chegar lá. 00:03:30.810 --> 00:03:33.779 Na parte de gerar o gráfico de barras, 00:03:33.779 --> 00:03:36.882 o script novamente está pronto de um control V. 00:03:36.882 --> 00:03:41.253 Vou recortar a parte que não nos interessa agora, que é essa outra parte 00:03:41.253 --> 00:03:44.657 aqui que só criando um dataframe 00:03:44.724 --> 00:03:47.226 para os dados de vendas. 00:03:47.226 --> 00:03:50.996 Eu vou apertar um enter e vou exibir e vou explicar para vocês 00:03:50.996 --> 00:03:56.535 o que tem essas cookie que tem ali naquela linha de execução que eu estava. 00:03:56.535 --> 00:03:58.604 Seis Executou e não nos ensinou. 00:03:58.604 --> 00:04:00.339 Vamos tentar entender agora. 00:04:00.339 --> 00:04:02.174 Talvez vocês consigam. 00:04:02.174 --> 00:04:05.745 Anteriormente nós tínhamos criado vendas com os valores dos oito meses, 00:04:05.745 --> 00:04:07.947 só que não nomeamos você olhando. 00:04:07.947 --> 00:04:12.918 Você sabe que esse do mês um, esse mês dois esse é o mês três até o mês oito. 00:04:12.985 --> 00:04:17.089 Só que a gente precisa dizer precisamos instruir o computador, 00:04:17.156 --> 00:04:20.192 esses dados referente a cada mês, Qual mês? 00:04:20.426 --> 00:04:22.361 Como que a gente faz isso? 00:04:22.361 --> 00:04:27.066 Criei aqui um dataframe que chama dados underline, vendas, 00:04:27.132 --> 00:04:30.035 a instrução, aquele velho instrução 00:04:30.035 --> 00:04:34.240 ou também conhecida que foi tema de outra aula data aponta o frame. 00:04:34.306 --> 00:04:38.177 Nós precisamos dizer então esse vai ser referente ao mês um. 00:04:38.277 --> 00:04:39.378 Esse é o mês dois. 00:04:39.378 --> 00:04:40.813 Como que a gente faz isso? 00:04:40.813 --> 00:04:43.816 Vamos criar uma coluna chamada Mês 00:04:43.916 --> 00:04:48.721 e pedir para nomear sequencialmente cada linha aqui, por exemplo. 00:04:48.721 --> 00:04:54.560 RAF Se fossem, se fosse aqui seis meses de vendas seria de 1 a 6. 00:04:54.660 --> 00:04:59.999 No nosso caso, não vamos manter aqui o valor oito e a outra coluna aqui 00:04:59.999 --> 00:05:04.737 eu vou manter o nome vendas, por isso que saiu esse resultado. 00:05:04.837 --> 00:05:07.206 E agora que o ambiente está preparado, 00:05:07.206 --> 00:05:11.076 nós podemos ir para nossa última parte novamente. 00:05:11.076 --> 00:05:14.413 Se vocês me permite, eu vou executar primeiro, 00:05:14.480 --> 00:05:16.282 vou mostrar o resultado 00:05:16.282 --> 00:05:19.952 que gerou do gráfico e agora vou explicar para vocês 00:05:20.019 --> 00:05:21.253 o que aconteceu aqui. 00:05:21.253 --> 00:05:26.925 Rafa, deixo sempre um comentário para conseguir entender o que está abaixo. 00:05:26.992 --> 00:05:31.730 Nós não tínhamos instalados e instalado os depot, agora nós vamos utilizar. 00:05:31.797 --> 00:05:36.902 Nós temos que fornecer para os de report a instrução de gerar o gráfico de barras, 00:05:36.969 --> 00:05:41.740 qual é a base de dados e a dados underline, vendas Forneci 00:05:41.807 --> 00:05:43.342 Eu tenho que dar nome. 00:05:43.342 --> 00:05:48.313 Nós temos o eixo um eixo que é o eixo X e o outro que é o Y. 00:05:48.380 --> 00:05:53.619 O eixo x eu atribui o nome de mês mês um mês dois mês três 00:05:53.619 --> 00:05:55.821 mês cota de um mês oito. 00:05:55.821 --> 00:05:58.957 E aqui é o volume de vendas mês Y. 00:05:59.124 --> 00:06:03.729 Isso é uma coisa convencional para conseguir verificar quanto a mês. 00:06:03.729 --> 00:06:07.533 Quatro Quanto que eu vendia aqui no intervalo 00:06:07.533 --> 00:06:11.537 entre 150 e 200 mês cinco por exemplo. 00:06:11.603 --> 00:06:14.373 Tá fácil de ver aqui que no mês cinco foi 200. 00:06:14.373 --> 00:06:16.275 Rafa, será que isso não é verdade? 00:06:16.275 --> 00:06:19.611 Você pode vim aqui olhar um, dois, três, 00:06:19.845 --> 00:06:24.483 quatro, cinco ou até mesmo em direto no nosso data frame. 00:06:24.550 --> 00:06:30.055 Ele está certo como foi projetado, não teria como errar aqui no último mês. 00:06:30.155 --> 00:06:33.859 E aí Rafa, Então onde está entre os 150 e 200? 00:06:33.959 --> 00:06:38.096 Tá certo, está mais próximo 200 ou 190. 00:06:38.197 --> 00:06:40.265 E como que isso é feito? Não se 00:06:40.332 --> 00:06:42.634 atribui um nome, o famoso e 00:06:42.634 --> 00:06:46.872 dá um nome ao eixo X, ao eixo Y. 00:06:46.939 --> 00:06:49.207 Outra parte muito interessante 00:06:49.207 --> 00:06:53.245 é você poder atribuir a cor que você quer que y data.frame. 00:06:53.345 --> 00:06:54.780 Só tenho um velho probleminha. 00:06:54.780 --> 00:06:56.748 Talvez um problema seria a solução. 00:06:56.748 --> 00:06:58.383 A cor tem que ser inglesa, 00:06:58.383 --> 00:07:02.154 que se fosse instrução em português seria azul, só que sem colocar blue. 00:07:02.254 --> 00:07:06.291 Aí você vai escolher a Rafa vermelha, então você 00:07:06.391 --> 00:07:08.093 vai ser branco aide. 00:07:08.093 --> 00:07:09.895 Você vai verificar qual é a cor que você quer. 00:07:09.895 --> 00:07:14.032 Suas barras aqui é o estado de identificação 00:07:14.132 --> 00:07:16.768 que você quer que ele gere gráfico de barras 00:07:16.768 --> 00:07:21.373 e esteja alinhado com os números a esquerda faz sentido? 00:07:21.440 --> 00:07:24.543 É esse GG Taiti ou Python 00:07:24.576 --> 00:07:28.280 é uma em inglês, Quer dizer, para traduzir em português quer dizer título. 00:07:28.380 --> 00:07:32.317 É que eu venho das mensais de novo, é o nome que você quiser. 00:07:32.384 --> 00:07:35.320 E aqui você tem que repetir o nome dos eixos. 00:07:35.320 --> 00:07:37.189 O que você colocou aqui? 00:07:37.189 --> 00:07:39.725 A recomendação não é repetir os nomes aqui Eixo 00:07:39.725 --> 00:07:43.295 X e eixo Y. 00:07:43.361 --> 00:07:46.498 Alcançamos nosso objetivo, que era conseguir com a linguagem R, 00:07:46.698 --> 00:07:48.700 criar gráfico de barras. 00:07:48.700 --> 00:07:52.237 E agora fica aquela velha dica para vocês 00:07:52.304 --> 00:07:56.741 pense em dados que vocês tem são parte financeira, alguma coisa, 00:07:56.741 --> 00:08:01.513 uma projeção que você queira fazer ou que se queira fazer uma análise. 00:08:01.580 --> 00:08:05.083 Você pode buscar na internet algum conjunto de dados, 00:08:05.183 --> 00:08:07.252 joga pra dentro do R a palavra jogar mesmo. 00:08:07.252 --> 00:08:12.224 Traga para dentro do R, utilize o GG Plot, coloque seus gráficos, 00:08:12.290 --> 00:08:16.495 mude a cor em vez de azul, coloque outra cor, mude o nome dos eixos 00:08:16.495 --> 00:08:20.332 X e Y e com isso você vai se sentindo mais confiante que você. 00:08:20.332 --> 00:08:22.434 Sim, conseguiu aprender a gerar gráficos.