0:00:07.707,0:00:12.491 Trabalhando com representações[br]gráficas em estatística, 0:00:12.491,0:00:17.443 é muito comum nós nos perguntarmos qual[br]gráfico que eu vou trabalhar, o que é melhor, 0:00:17.443,0:00:21.991 qual que é a melhor situação, onde é[br]que eu aplico tais gráficos diferentes, 0:00:21.991,0:00:27.744 rosca, pizza, que é o gráfico de setor,[br]histograma, gráfico de barra, 0:00:27.744,0:00:33.588 linha de tendência, polígono de frequência,[br]que vai ser uma junção de gráfico de barra 0:00:33.588,0:00:34.562 com linha de tendência, 0:00:34.562,0:00:40.783 existem várias coisas onde nós podemos[br]permear e trabalhar em cima disso. 0:00:40.783,0:00:44.884 E, agora, vamos falar de[br]duas classes de gráficos 0:00:44.884,0:00:48.054 comumente utilizadas no meio[br]estatístico, que é o gráfico de setor, 0:00:48.054,0:00:49.513 que nós conhecemos[br]como gráfico de pizza, 0:00:49.513,0:00:54.512 aquele gráfico redondinho, onde nós[br]dividimos, normalmente, por porcentagens 0:00:54.512,0:01:00.261 e assim por diante, e também o histograma,[br]que tem a ver com a distribuição estatística, 0:01:00.261,0:01:04.762 então eu tenho que calcular[br]a frequência, distribuir isso em barras, 0:01:04.762,0:01:09.141 e ali ordeno as minhas classes[br]em ordem crescente 0:01:09.141,0:01:12.786 para ver como é que está[br]a distribuição dos meus dados. 0:01:12.786,0:01:16.460 Diz que, se os dados se aproximam[br]de uma distribuição gaussiana, 0:01:16.460,0:01:18.693 que nós chamamos[br]de distribuição normal, 0:01:18.693,0:01:23.981 a tendência é que o maior número[br]de frequência bata ali na média, 0:01:23.981,0:01:26.124 é quando nós plotamos[br]a tendência ali. 0:01:26.124,0:01:28.967 Então, vamos analisar um pouquinho[br]os dois tipos de gráfico 0:01:28.967,0:01:31.752 para ver como é que nós[br]trabalhamos com eles visualmente, 0:01:31.752,0:01:34.156 tentamos entender alguma[br]aplicação e assim por diante. 0:01:34.156,0:01:36.080 Então, vem comigo aqui. 0:01:36.080,0:01:40.183 Temos aqui a criação, por exemplo,[br]utilizando a linguagem Python, 0:01:40.183,0:01:45.750 de um gráfico de setor, onde nós[br]definimos valores e rótulos, está certo? 0:01:45.750,0:01:51.359 Então, 10 para o A, 20 para o B,[br]30 para o C, 40 para o D, 50 para o E. 0:01:51.359,0:01:54.236 Então, nós dividimos aqui[br]proporcionalmente. 0:01:54.236,0:01:58.541 Veja que o E é maior, porque ele[br]recebe a maior quantidade aqui. 0:01:58.541,0:02:01.938 Então, o gráfico de setor é[br]comum para nós, por exemplo, 0:02:01.938,0:02:07.928 calcularmos em classes as porcentagens deles,[br]nós colocarmos rótulo e assim por diante. 0:02:07.928,0:02:11.082 Então, tem até uma variação[br]aqui embaixo, por exemplo, 0:02:11.082,0:02:15.887 do gráfico de setor[br]utilizando porcentagens. 0:02:15.887,0:02:20.049 Então, nós só mudamos aqui[br]um parâmetro de autoporcentagem, 0:02:20.049,0:02:24.230 onde, aquilo que estava aqui em cima,[br]eu consiga distribuir em porcentagem. 0:02:24.230,0:02:31.331 Então, você fala assim: "olha, cinco[br]grupos analisados, grupo A, B, C, D e E, 0:02:31.331,0:02:35.683 33.3% representam o grupo E",[br]então ele é a maioria, 0:02:35.683,0:02:38.847 por exemplo, se fosse quantidade[br]de pessoas, seria a maioria, 0:02:38.847,0:02:43.492 seguido do grupo D, grupo C,[br]B e terminando pelo grupo A. 0:02:43.492,0:02:47.199 Então, isso aqui é muito importante,[br]é um tipo de gráfico bem específico, 0:02:47.199,0:02:51.848 não é legal nós trabalharmos com muitas[br]subdivisões, porque ele fica muito poluído, 0:02:51.848,0:02:55.712 mas ele é interessante para nós[br]termos noção de densidade 0:02:55.712,0:02:58.849 e vermos qual que é, por exemplo,[br]a maior porcentagem. 0:02:58.849,0:03:01.773 É muito interessante nós[br]utilizarmos esse gráfico de setor, 0:03:01.773,0:03:04.923 porque, através dos setores,[br]nós conseguimos ver. 0:03:04.923,0:03:09.915 Óbvio que o olho humano, dependendo[br]se as porcentagens são muito próximas, 0:03:09.915,0:03:12.562 a área, visualmente falando[br]para os nossos olhos, 0:03:12.562,0:03:16.509 talvez não seja algo[br]tão distinguível assim. 0:03:16.509,0:03:20.841 Ou seja, nós não conseguiríamos[br]diferenciar duas classes diferentes, 0:03:20.841,0:03:24.285 o que pode ser um problema, então[br]nós temos que tomar muito cuidado 0:03:24.285,0:03:27.765 com o tipo de gráfico para não[br]cometer esse tipo de erro. 0:03:27.765,0:03:31.733 Então, a diferença é que esse[br]aqui só tem o âmbito visual, 0:03:31.733,0:03:33.265 é legal nós colocarmos um rótulo 0:03:33.265,0:03:38.054 para nós termos, numericamente,[br]uma noção do que está acontecendo. 0:03:38.054,0:03:42.726 E, seguindo, aqui nós temos um histograma[br]onde nós pegamos, por exemplo, 0:03:42.726,0:03:48.937 uma distribuição de dados, onde eu[br]pego aqui um tipo de distribuição, 0:03:48.937,0:03:53.219 aqui eu utilizei uma distribuição[br]randômica do tipo normal, está certo? 0:03:53.219,0:03:54.711 Normal por quê? 0:03:54.711,0:03:57.306 Distribuição normal é[br]uma distribuição gaussiana, 0:03:57.306,0:04:01.954 se nós colocarmos uma linha de tendência[br]aqui, ele vai ter uma curva diferenciada, 0:04:01.954,0:04:09.536 se eu fizer, por exemplo,[br]um "plt.plot" nos dados, 0:04:09.536,0:04:13.856 chegar aqui e trabalhar com uma cor[br]vermelha, por exemplo, 0:04:14.992,0:04:18.116 nós vamos trabalhar aqui[br]com um tipo de distribuição. 0:04:18.116,0:04:22.247 Óbvio que agora ele colocou os plots[br]um pouquinho diferentes, propriamente dito, 0:04:22.247,0:04:25.858 e ele colocou agora em uma aleatoriedade,[br]ele transformou tudo. 0:04:25.858,0:04:28.706 Então, eu vou comentar[br]essa linha de código 0:04:28.706,0:04:31.862 só para nós não perdermos[br]o que fizemos anteriormente. 0:04:31.862,0:04:35.065 Ah, e vou travar[br]uma aleatoriedade também 0:04:35.065,0:04:42.383 para nós não sairmos com mudanças[br]bruscas no nosso cenário. 0:04:42.383,0:04:45.000 Então, eu vou trabalhar aqui[br]com o 42, por exemplo, 0:04:45.000,0:04:48.734 nós temos aqui[br]uma distribuição específica. 0:04:48.734,0:04:53.615 Isso aqui é uma funçãozinha computacional[br]que pode nos ajudar muito, bastante, 0:04:53.615,0:04:57.878 porque nós temos aqui[br]algumas possibilidades. 0:04:57.878,0:05:01.859 E veja que, colocando o cursor[br]aqui na tela, apareceu um pop-up, 0:05:01.859,0:05:05.650 onde nós temos uma janelinha onde[br]ele explica, aqui dentro dessa função, 0:05:05.650,0:05:08.416 como é que eu poderia trabalhar,[br]alguns parâmetros diferentes, 0:05:08.416,0:05:13.135 ele dá uma documentação,[br]um overview geral dessa função aqui. 0:05:13.135,0:05:16.906 Então, além dos dados, eu poderia,[br]por exemplo, colocar aqui: 0:05:16.906,0:05:21.311 qual é o range, densidade,[br]se ele é acumulativo, está certo? 0:05:21.311,0:05:25.978 Qual que é o tipo de histograma, que pode[br]ser barra, pode ser outros tipos. 0:05:25.978,0:05:29.947 A orientação, vertical, eu posso[br]trocar isso aqui para a horizontal. 0:05:29.947,0:05:33.879 Existe uma série de coisas[br]aqui que eu posso trabalhar, 0:05:33.879,0:05:39.144 transformação logarítmica,[br]entre outras coisas, então aqui. 0:05:39.144,0:05:43.110 Só que isso aqui diferencia,[br]por exemplo, de um gráfico de barra, 0:05:43.110,0:05:44.601 onde as barras são separadas. 0:05:44.601,0:05:48.561 Aqui, a ideia é ser junto mesmo,[br]então nós temos umas barras unidas 0:05:48.561,0:05:51.515 onde nós só pegamos[br]o contorno das barras, 0:05:51.515,0:05:57.389 porque o mais importante para nós é[br]sabermos onde a quantidade bate na classe. 0:05:57.389,0:06:02.588 Então, por exemplo, nós sabemos[br]que na distribuição uniforme aqui de -3, 0:06:02.588,0:06:06.936 vamos ver assim, um pouco[br]para lá de -3 até 4, 0:06:06.936,0:06:10.150 nós temos uma distribuição que dá[br]aproximadamente no 0, que seria o meio. 0:06:10.150,0:06:15.252 Então, a média, a mediana e a moda,[br]aproximadamente, dessa distribuição, 0:06:15.252,0:06:21.219 são iguais, se nós fossemos [br]calcular teoricamente falando aqui. 0:06:21.219,0:06:25.404 Então, o histograma é utilizado para nós[br]analisarmos distribuições estatísticas, 0:06:25.404,0:06:29.488 para nós sabermos se a distribuição é[br]normal, de Poisson e assim por diante, 0:06:29.488,0:06:35.404 diferente desse gráfico anterior aqui[br]onde tem outros resultados específicos. 0:06:35.404,0:06:42.262 E as distribuições são várias,[br]Poisson, normal, Bernoulli, 0:06:42.262,0:06:45.086 binomial, tem vários[br]tipos de distribuição 0:06:45.086,0:06:48.654 e, na verdade, aqui não interessa[br]qual é o tipo de distribuição, 0:06:48.654,0:06:51.013 o mais importante é que eu[br]consigo plotar histograma 0:06:51.013,0:06:54.036 para todas as distribuições possíveis. 0:06:54.036,0:06:57.654 Então, veja que agora trabalhamos[br]com mais duas classes de gráficos, 0:06:57.654,0:07:02.256 ou seja, entendemos um pouquinho[br]mais onde nós podemos aplicar isso. 0:07:02.256,0:07:05.055 Só que, novamente, é[br]relativo ao seu problema. 0:07:05.055,0:07:08.763 Então, se você quiser utilizar isso[br]em um contexto econômico 0:07:08.763,0:07:14.426 ou em um contexto, por exemplo, de análise[br]ambiental, em uma inteligência artificial, 0:07:14.426,0:07:16.275 em um algoritmo de aprendizado[br]de máquina, 0:07:16.275,0:07:19.448 isso pode depender muito[br]do que você quer fazer, 0:07:19.448,0:07:22.889 e aqui tem várias[br]possibilidades. 0:07:22.889,0:07:25.298 E falando em várias possibilidades, 0:07:25.298,0:07:30.735 isso pode impactar diretamente[br]com aquilo que você é proposto a fazer. 0:07:30.735,0:07:36.198 Então estude, procure bastante[br]aplicação, utilize um recurso gráfico 0:07:36.198,0:07:38.460 ou a própria programação,[br]como nós vimos, 0:07:38.460,0:07:41.463 para que esse estudo[br]seja cada vez mais eficaz 0:07:41.463,0:07:45.513 e que as aplicações se tornem[br]cada vez mais fáceis.