Trabalhando com representações gráficas em estatística, é muito comum nós nos perguntarmos qual gráfico que eu vou trabalhar, o que é melhor, qual que a melhor situação, onde é que eu aplico tais gráficos diferentes, rosca, pizza, que é o gráfico do setor, histograma, gráfico de barra, linha de tendência, polígono de frequência que vai ser uma junção de gráfico de barra com linha de tendência, existem várias coisas onde nós podemos permear e trabalhar em cima disso. E, agora, vamos falar de duas classes de gráficos comumente utilizadas no meio estatístico, que é o gráfico de setor, que nós conhecemos como gráfico de pizza, aquele gráfico redondinho onde nós dividimos, normalmente, por porcentagens e assim por diante, e também o histograma que tem a ver com a distribuição estatística, então eu tenho que calcular frequência, distribuir isso em barras e ali ordeno as minhas classes em ordem crescente para ver como é que está a distribuição dos meus dados. Diz que se os dados se aproximam de uma distribuição gaussiana, que nós chamamos de distribuição normal, a tendência é que o maior número de frequência bata ali na média, é quando nós plotamos a tendência ali. Então, vamos analisar um pouquinho os dois tipos de gráfico para ver como é que nós trabalhamos com eles visualmente, tentamos entender alguma aplicação e assim por diante. Então, vem comigo aqui. Temos aqui a criação, por exemplo, utilizando a linguagem Python, de um gráfico de setor, onde nós definimos valores e rótulos, está certo? Então, 10 para o A, 20 para o B, 30 para o C, 40 para o D, 50 para o E. Então, nós dividimos aqui proporcionalmente. Veja que o E é maior, porque ele recebe a maior quantidade aqui. Então, o gráfico de setor é comum para nós, por exemplo, calcularmos em classes as porcentagens deles, nós colocarmos rótulo e assim por diante. Então, tem até uma variação aqui embaixo, por exemplo, do gráfico de setor utilizando porcentagens. Então, nós só mudamos aqui um parâmetro de autoporcentagem, onde, aquilo que estava aqui em cima, eu consiga distribuir em porcentagem. Então você fala assim: "olha, cinco grupos analisados grupo A, B, C, D e E, 33.3% representa o grupo E, então ele é a maioria, por exemplo, se fosse quantidade de pessoas, seria a maioria seguido do grupo D, grupo C, B e terminando pelo grupo A. Então, isso daqui é muito importante, é um tipo de gráfico bem específico, não é legal nós trabalharmos com muitas subdivisões, porque ele fica muito poluído, mas ele é interessante para nós termos noção de densidade aqui e vermos qual que é, por exemplo, a maior porcentagem. É muito interessante nós utilizarmos esse gráfico do setor, porque através dos setores nós conseguimos ver. Óbvio que o olho humano, dependendo se as porcentagens são muito próximas, a área, visualmente falando para os nossos olhos, talvez não seja algo tão distinguível assim. Ou seja, nós não conseguiríamos diferenciar duas classes diferentes, o que pode ser um problema, então nós temos que tomar muito cuidado com o tipo de gráfico para não cometer esse tipo de erro. Então, a diferença é que esse aqui só tem o âmbito visual, é legal nós colocarmos um rótulo para nós termos numericamente uma noção do que está acontecendo. E, seguindo, aqui nós temos um histograma onde nós pegamos, por exemplo, uma distribuição de dados, onde eu pego aqui um tipo de distribuição, que aqui eu utilizei, uma distribuição randômica do tipo normal, está certo? Normal por quê? Distribuição normal é uma distribuição gaussiana, se nós colocarmos uma linha de tendência aqui, ele vai ter uma curva diferenciada, se eu fizer, por exemplo, um "plt.plot" nos dados, chegar aqui e trabalhar com uma cor vermelha, por exemplo, nós vamos trabalhar aqui com o tipo de distribuição. Óbvio que agora ele colocou os plots um pouquinho diferentes, propriamente dito, e ele colocou agora em uma aleatoriedade, ele transformou tudo. Então, eu vou comentar essa linha de código só para nós não perdermos o que fizemos anteriormente. Ah, e vou travar uma aleatoriedade também para nós não sairmos com mudanças bruscas no nosso cenário. Então, eu vou trabalhar aqui com o 42, por exemplo, nós temos aqui uma distribuição específica. Isso aqui é uma funçãozinha computacional que pode nos ajudar muito, bastante aqui, porque nós temos aqui algumas possibilidades. E veja que colocando um cursor aqui na tela irá aparecer um popup aonde nós temos aqui uma janelinha onde ele explica aqui dentro dessa função, como é que eu poderia trabalhar alguns parâmetros diferentes. Ele dá uma documentação overview geral dessa função aqui. Então, além dos dados, eu poderia, por exemplo colocar aqui qual é o de densidade, se ele acumulativo tá certo? Qual que é o tipo de histograma que pode ser barra? Pode ser outros tipos orientação vertical? Posso trocar isso daqui para a horizontal? Existe uma série de coisas aqui que eu posso trabalhar na transformação logarítmica, entre outras coisas, então aqui. Só que isso daqui diferencia, por exemplo, de um gráfico de barras onde as barras são separadas. Aqui a ideia ser junto mesmo. Então a gente tem umas barras unidas onde a gente só pega o contorno das barras, porque o mais importante para a gente a gente saber aonde a quantidade bate na classe. Então, por exemplo, a gente sabe que na distribuição uniforme aqui de -3, vamos ver assim um pouco pra lá de -3 até quatro. Nós temos uma distribuição que dá aproximadamente no zero, que seria o meio. Então a média, a mediana é a moda aproximadamente dessa distribuição é igual. Se a gente fosse calcular teoricamente falando aqui, então o histograma ele é utilizado para a gente analisar a distribuição estatísticas, para a gente saber se a distribuição é normal de Poisson e assim por diante. Diferente desse gráfico anterior, aqui onde tem outros resultados específicos e as distribuições são várias Poisson normal Bernoulli A binomial tem vários tipos de distribuição que na verdade aqui não interessa qual é o tipo de distribuição. O mais importante é que eu consigo plotar histograma para todas as distribuições possíveis. Então veja que agora trabalhamos com mais duas classes de gráficos, ou seja, entendemos um pouquinho mais onde a gente pode aplicar isso. Só que novamente a relativa o seu problema. Então, se você quiser utilizar isso num contexto econômico ou num contexto, por exemplo, a análise ambiental numa inteligência artificial ou no algoritmo de aprendizado de máquina, isso pode depender muito do que você quer fazer. E aqui tem várias possibilidades. E falando em várias possibilidades, isso pode impactar diretamente com aquilo que você está proposto a fazer. Então estude, procure bastante a aplicação, utilize um recurso gráfico ou a própria programação, como nós vimos, para que esse estudo seja cada vez mais eficaz e que as aplicações se tornem cada vez mais fáceis de.