WEBVTT 00:00:08.041 --> 00:00:08.808 Com certeza, no seu cotidiano, 00:00:08.808 --> 00:00:11.811 você já se deparou com a necessidade de interpretar um gráfico de barras, 00:00:14.814 --> 00:00:17.784 ou até mesmo ter que fazer um gráfico de barras, 00:00:17.784 --> 00:00:22.055 talvez no Excel ou talvez em alguma linguagem de programação. 00:00:22.122 --> 00:00:23.189 E não ia ser diferente. 00:00:23.189 --> 00:00:26.192 Aqui vocês vão também vão aprender a fazer com a linguagem R. 00:00:26.326 --> 00:00:28.828 Vem comigo que eu vou mostrar para vocês. 00:00:28.828 --> 00:00:30.463 Aqui eu deixei o script pré-pronto. 00:00:30.463 --> 00:00:33.800 Como sempre, eu tento deixar um comentário e um código comentado para vocês 00:00:33.900 --> 00:00:39.506 para que facilite a interpretação legal aqui. 00:00:39.506 --> 00:00:43.443 Na primeira parte, nós iremos executar juntos, tudo bem? 00:00:43.510 --> 00:00:48.081 E aqui, nessa primeira parte, vem o conteúdo que vocês viram anteriormente, 00:00:48.081 --> 00:00:52.118 que seria esse esse tal ponto. 00:00:52.185 --> 00:00:52.986 O que seria isso? 00:00:52.986 --> 00:00:55.221 "Rafa, vamos digitar juntos install, lembra?" 00:00:55.221 --> 00:00:56.022 Ponto. Pede. 00:00:56.022 --> 00:00:59.292 Lembre-se que o R da uma sugestão para vocês. 00:00:59.359 --> 00:01:01.928 E agora nós iremos utilizar quem? 00:01:01.928 --> 00:01:04.397 O ggplot2, tá? 00:01:04.397 --> 00:01:07.400 "Você falou, Rafa, mas isso não saiu de cabeça." 00:01:07.600 --> 00:01:12.538 Tem diversos tipos de pacotes que vocês utilizam durante a programação 00:01:12.639 --> 00:01:15.576 para fazer o gráfico de barras. 00:01:15.576 --> 00:01:16.576 Você tem que utilizar o ggplot2. 00:01:16.576 --> 00:01:21.314 Observando aqui, agora nós temos que instalar esse pacote. 00:01:21.381 --> 00:01:24.851 Se vocês apertaram Enter, vocês tem que aguardar, não é? 00:01:24.984 --> 00:01:28.321 Lembre-se que não é porque está com vermelho que tem que ter um problema. 00:01:28.388 --> 00:01:33.126 Tudo bem se vocês tentarem interpretar o que está aqui. 00:01:33.226 --> 00:01:37.497 Na parte Warning, não é um erro, é um aviso. 00:01:37.597 --> 00:01:41.000 Caso vocês queiram traduzir, fiquem à vontade, tudo bem? 00:01:41.067 --> 00:01:43.536 E perceba que foi instalado aqui com sucesso. 00:01:43.536 --> 00:01:49.342 Fez um download e adicionou para dentro do nosso estúdio. 00:01:49.442 --> 00:01:52.446 E aí você fala: "Vamos para a próxima parte agora, Rafa?" 00:01:52.446 --> 00:01:53.446 Vamos deixar o script pronto aqui para nós. 00:01:53.446 --> 00:01:56.349 Qual é essa próxima parte, Rafa? 00:01:56.349 --> 00:02:00.586 Sempre que estivermos lá, precisaremos chamar essa biblioteca? 00:02:00.653 --> 00:02:03.323 Olhe aqui esse pacote... 00:02:03.323 --> 00:02:04.323 Ou melhor, teclas do ggplot2 foram instaladas aqui dentro do R Studio, NOTE Paragraph 00:02:04.323 --> 00:02:08.861 então ele está pronto para ser utilizado. 00:02:08.928 --> 00:02:11.764 Foi adicionado, por isso que foi feito o download, tudo bem? 00:02:12.665 --> 00:02:15.902 E agora nós precisamos chamar para que essa tela que nós estamos programando agora 00:02:17.603 --> 00:02:21.274 consiga se utilizar das funcionalidades do ggplot2. 00:02:21.340 --> 00:02:22.675 Vamos dar o Enter. 00:02:22.675 --> 00:02:24.178 Aí apareceu um erro de novo. 00:02:24.178 --> 00:02:25.178 Não é um erro. 00:02:25.178 --> 00:02:27.448 Se você achar que é um erro, não é. 00:02:27.448 --> 00:02:28.448 Fiquem espertos. 00:02:28.448 --> 00:02:31.350 Uma mensagem de alerta, tá? 00:02:31.350 --> 00:02:35.221 Agora que nós já temos um ambiente preparado, já instalamos o pacote do ggplot, 00:02:36.088 --> 00:02:38.791 nós vamos agora simular uma situação, ter uma base de dados aqui com as vendas, 00:02:41.828 --> 00:02:45.566 por exemplo, uma empresa de sapatos. 00:02:45.566 --> 00:02:46.566 E depois nós iremos projetar esses gráficos. 00:02:46.566 --> 00:02:49.001 Vou mostrar a minha tela para vocês aqui. 00:02:49.001 --> 00:02:54.307 Eu deixei um script pronto para podermos gerar uma base de dados, 00:02:54.373 --> 00:02:57.610 ou apertar um Control + X, que seria esse vendas aqui, 00:02:57.610 --> 00:03:00.947 um intervalo de venda de oito meses de uma empresa. 00:03:01.013 --> 00:03:04.784 no primeiro mês vender eu senti 20 R$ supondo o segundo 150, 00:03:04.784 --> 00:03:08.087 o terceiro teve uma queda, depois subiu novamente. 00:03:08.154 --> 00:03:11.824 Nem sempre as vendas apresentam uma ordem crescente ou decrescente. 00:03:11.857 --> 00:03:14.260 Isso aqui é um cenário normal. 00:03:14.260 --> 00:03:18.664 Lógico que o esperado de uma empresa são as vendas serem sempre crescentes. 00:03:18.731 --> 00:03:21.634 Agora vamos exibir esses dados. 00:03:21.634 --> 00:03:24.637 A gente vendas 00:03:24.737 --> 00:03:27.340 enter os dados estão aqui, armazená-los 00:03:27.340 --> 00:03:30.743 e aí vamos dar mais um passo para tentarmos chegar 00:03:30.810 --> 00:03:33.779 lá na parte de gerar o gráfico de barras, 00:03:33.779 --> 00:03:36.882 o script novamente está pronto de um control V. 00:03:36.882 --> 00:03:41.253 Eu vou recortar a parte que não nos interessa agora, que é essa outra parte aqui, 00:03:41.253 --> 00:03:44.657 que só está criando um dataframe para os dados de vendas. 00:03:47.226 --> 00:03:50.996 Eu vou apertar um Enter, vou exibir, e vou explicar para vocês 00:03:50.996 --> 00:03:56.535 o que tem essas cookie que tem ali naquela linha de execução que eu estava. 00:03:56.535 --> 00:03:58.604 Seis Executou e não nos ensinou. 00:03:58.604 --> 00:04:00.339 Vamos tentar entender agora. 00:04:00.339 --> 00:04:02.174 Talvez vocês consigam. 00:04:02.174 --> 00:04:05.745 Anteriormente, nós tínhamos criado vendas com os valores dos oito meses, 00:04:05.745 --> 00:04:07.947 só que não nomeamos você olhando. 00:04:07.947 --> 00:04:12.918 Você sabe que esse é o mês um, esse é o mês dois, esse é o mês três, até o mês oito. 00:04:12.985 --> 00:04:17.089 Só que precisamos instruir o computador, os dados referente a cada mês, 00:04:17.156 --> 00:04:20.192 Qual mês? 00:04:20.426 --> 00:04:22.361 Como fazemos isso? 00:04:22.361 --> 00:04:27.066 Criei aqui um dataframe que se chama "dados_vendas" 00:04:27.132 --> 00:04:30.035 aquela velha instrução 00:04:30.035 --> 00:04:34.240 ou também conhecida que foi tema de outra aula data aponta o frame. 00:04:34.306 --> 00:04:38.177 Nós precisamos dizer então que esse vai ser referente ao mês um. 00:04:38.277 --> 00:04:39.378 Esse é o mês dois. 00:04:39.378 --> 00:04:40.813 Como fazemos isso? 00:04:40.813 --> 00:04:43.816 Vamos criar uma coluna chamada "Mês" 00:04:43.916 --> 00:04:48.721 e pedir para nomear sequencialmente cada linha aqui, por exemplo. 00:04:48.721 --> 00:04:54.560 Se aqui fosse seis meses de vendas seria de 1 a 6. 00:04:54.660 --> 00:04:59.999 No nosso caso, não vamos manter aqui o valor oito e a outra coluna aqui. 00:04:59.999 --> 00:05:04.737 Eu vou manter o nome vendas, por isso que saiu esse resultado. 00:05:04.837 --> 00:05:07.206 E agora que o ambiente está preparado, 00:05:07.206 --> 00:05:11.076 nós podemos ir para a nossa última parte novamente. 00:05:11.076 --> 00:05:14.413 Se vocês me permitem, eu vou executar primeiro. 00:05:14.480 --> 00:05:16.282 Eu vou mostrar o resultado que gerou do gráfico. 00:05:16.282 --> 00:05:19.952 E agora eu vou explicar para vocês o que aconteceu aqui. 00:05:21.253 --> 00:05:26.925 "Rafa, deixo sempre um comentário para conseguir entender o que está abaixo. 00:05:26.992 --> 00:05:30.797 Nós não tínhamos instalado o ggplot. 00:05:30.797 --> 00:05:31.797 Agora nós vamos utilizar. 00:05:31.797 --> 00:05:36.902 Nós temos que fornecer para o ggplot a instrução de gerar o gráfico de barras, 00:05:36.969 --> 00:05:41.740 qual é a base de dados, e a "dados_vendas". 00:05:41.807 --> 00:05:43.342 Eu tenho que dar nome. 00:05:43.342 --> 00:05:48.313 Nós temos o eixo um, que é o eixo X, e o outro que é o Y. 00:05:48.380 --> 00:05:53.619 Ao eixo X, eu atribui o nome de mês um, mês dois, mês três, 00:05:53.619 --> 00:05:55.821 mês cota de um mês oito. 00:05:55.821 --> 00:05:58.957 E aqui é o volume de vendas do mês Y. 00:05:59.124 --> 00:06:03.729 Isso é uma coisa convencional para conseguir verificar quanto a mês. 00:06:03.729 --> 00:06:07.533 Quatro Quanto que eu vendia aqui no intervalo 00:06:07.533 --> 00:06:11.537 entre 150 e 200 mês cinco, por exemplo. 00:06:11.603 --> 00:06:14.373 Está fácil de ver aqui que no mês cinco foi 200. 00:06:14.373 --> 00:06:16.275 "Rafa, será que isso não é verdade?" 00:06:16.275 --> 00:06:19.611 Você pode vir aqui olhar: um, dois, três, quatro, cinco, 00:06:19.845 --> 00:06:24.483 ou até mesmo ir direto ao nosso data frame. 00:06:24.550 --> 00:06:30.055 Ele está certo como foi projetado, não teria como errar aqui no último mês. 00:06:30.155 --> 00:06:33.859 Então, Rafa, onde estão entre os 150 e 200? 00:06:33.959 --> 00:06:38.096 Tá certo, está mais próximo 200 ou 190. 00:06:38.197 --> 00:06:40.265 E como é feito isso? 00:06:40.332 --> 00:06:42.634 Não se atribui um nome, o famoso e 00:06:42.634 --> 00:06:46.872 dá um nome ao eixo X, ao eixo Y. 00:06:46.939 --> 00:06:49.207 Outra parte muito interessante é você poder atribuir a cor que você quiser 00:06:49.207 --> 00:06:53.245 que y data.frame. 00:06:53.345 --> 00:06:54.780 Só tem um velho probleminha. 00:06:54.780 --> 00:06:56.748 Talvez um problema seria a solução. 00:06:56.748 --> 00:06:58.383 A cor tem que ser inglesa, 00:06:58.383 --> 00:07:02.154 Se fosse instrução em português, seria azul, só que tem que colocar blue. 00:07:02.254 --> 00:07:06.291 Aí você vai escolher a Rafa vermelha, então você 00:07:06.391 --> 00:07:08.093 vai ser branco aide. 00:07:08.093 --> 00:07:09.895 Você vai verificar qual é a cor que você quer. 00:07:09.895 --> 00:07:14.032 Suas barras aqui é o estado de identificação 00:07:14.132 --> 00:07:16.768 que você quer que ele gere gráfico de barras 00:07:16.768 --> 00:07:21.373 e esteja alinhado com os números a esquerda faz sentido? 00:07:21.440 --> 00:07:24.543 É esse GG Taiti ou Python 00:07:24.576 --> 00:07:28.280 é uma em inglês, Quer dizer, para traduzir em português quer dizer título. 00:07:28.380 --> 00:07:32.317 É que eu venho das mensais de novo, é o nome que você quiser. 00:07:32.384 --> 00:07:35.320 E aqui você tem que repetir o nome dos eixos. 00:07:35.320 --> 00:07:37.189 O que você colocou aqui? 00:07:37.189 --> 00:07:39.725 A recomendação não é repetir os nomes aqui, eixo X e eixo Y. 00:07:43.361 --> 00:07:46.498 Alcançamos nosso objetivo, que era conseguir criar gráfico de barras com a linguagem R. 00:07:48.700 --> 00:07:52.237 E agora fica aquela velha dica para vocês: 00:07:52.304 --> 00:07:56.741 pense em dados que vocês tem, seja parte financeira, alguma coisa, 00:07:56.741 --> 00:08:01.513 uma projeção que você queira fazer ou que se queira fazer uma análise. 00:08:01.580 --> 00:08:05.083 Você pode buscar na internet algum conjunto de dados, jogue paqra dentro do R. NOTE Paragraph 00:08:05.183 --> 00:08:07.252 A palavra é jogar mesmo. 00:08:07.252 --> 00:08:12.224 Traga para dentro do R, utilize o ggplot, coloque seus gráficos, mude a cor. 00:08:12.290 --> 00:08:16.495 Em vez de azul, coloque outra cor. 00:08:16.495 --> 00:08:19.332 Mude o nome dos eixos X e Y. 00:08:19.332 --> 00:08:20.332 E, com isso, você vai se sentindo mais confiante 00:08:20.332 --> 00:08:22.434 porque você conseguiu aprender a gerar gráficos.