Trabalhando com representações gráficas em estatística, é muito comum nós nos perguntarmos qual gráfico que eu vou trabalhar, o que é melhor, qual que a melhor situação, onde é que eu aplico tais gráficos diferentes, rosca, pizza, que é o gráfico do setor, histograma, gráfico de barra, linha de tendência, polígono de frequência que vai ser uma junção de gráfico de barra com linha de tendência, existem várias coisas onde nós podemos permear e trabalhar em cima disso. E, agora, vamos falar de duas classes de gráficos comumente utilizadas no meio estatístico, que é o gráfico de setor, que nós conhecemos como gráfico de pizza, aquele gráfico redondinho onde nós dividimos, normalmente, por porcentagens e assim por diante, e também o histograma que tem a ver com a distribuição estatística, então eu tenho que calcular frequência, distribuir isso em barras e ali ordeno as minhas classes em ordem crescente para ver como é que está a distribuição dos meus dados. Diz que se os dados se aproximam de uma distribuição gaussiana, que nós chamamos de distribuição normal, a tendência é que o maior número de frequência bata ali na média, é quando nós plotamos a tendência ali. Então, vamos analisar um pouquinho os dois tipos de gráfico para ver como é que nós trabalhamos com eles visualmente, tentamos entender alguma aplicação e assim por diante. Então, vem comigo aqui. Temos aqui a criação, por exemplo, utilizando a linguagem Python, de um gráfico de setor, onde nós definimos valores e rótulos. Está certo? Então dez para o ar, 20 pro B, 30 pro C, 40 para o D, 50 para o E. Então a gente divide aqui proporcional. Veja que o é maior porque ele recebe a maior quantidade aqui. Então o gráfico de setor, ele é comum para a gente, por exemplo, calcular em classes as porcentagens deles, a gente colocar rótulo e assim por diante. Então tem até uma variação aqui embaixo, por exemplo, do gráfico de um setor utilizando porcentagens. Então a gente só muda aqui um parâmetro de alto porcentagem, aonde aquilo que estava aqui em cima eu consegui distribuir em porcentagem. Então você falar assim olha, cinco grupos analisados grupo AABCD, E E, 33,3% representa o grupo e então ele é a maioria. Por exemplo, se fosse quantidade de pessoas, seria a maioria seguido do grupo D, grupo C, B e terminando pelo grupo. Então isso daqui é muito importante. É um tipo de gráfico bem específico. Não é legal a gente trabalhar com muitas subdivisões, porque ele fica muito poluído. Mas ele é interessante para a gente ter noção de densidade aqui e vê qual que é, por exemplo, a maior porcentagem. É muito interessante a gente utilizar esse gráfico do setor, porque através dos setores a gente consegue ver óbvio que o olho humano, dependendo se as porcentagens são muito próximas à área, visualmente falando, para os nossos olhos talvez não seja algo tão distinguível assim. Ou seja, a gente não conseguiria diferenciar duas classes diferentes, o que pode ser um problema. Então a gente tem que tomar muito cuidado com o tipo de gráfico para não cometer esse tipo de erro. Então, a diferença é que esse daqui só tem o âmbito visual. É legal a gente colocar um rótulo para a gente ter numericamente uma noção do que está acontecendo. E seguindo aqui nós temos um histograma aonde a gente pega, por exemplo, uma distribuição de dados, onde eu pego aqui um tipo de distribuição que aqui eu utilizei, uma distribuição randômica do tipo normal. Tá certo, Normal porque distribuição normal é uma distribuição gaussiana. Se a gente colocar uma linha de tendência que ele vai ter uma curva diferenciada. Se eu fizer, por exemplo, um PLT ponto plot, por exemplo, nos dados, chegar aqui, trabalhar com uma cor vermelha, por exemplo, a gente vai trabalhar aqui com o tipo de distribuição. Óbvio que agora ele colocou os plots um pouquinho diferentes propriamente dito e ele colocou agora numa aleatoriedade, ele transformou tudo. Então vou comentar essa linha de código só pra gente não perder o que fizemos anteriormente e vou travar uma aleatoriedade também para a gente não sair com mudanças bruscas no nosso cenário. Então vou trabalhar aqui com o 42, por exemplo. Nós temos aqui uma distribuição específica. Isso daqui é uma função zinha computacional que pode nos ajudar muito, bastante aqui, porque a gente tem aqui algumas possibilidades. E veja que colocando um cursor aqui na tela irá aparecer um popup aonde nós temos aqui uma janelinha onde ele explica aqui dentro dessa função, como é que eu poderia trabalhar alguns parâmetros diferentes. Ele dá uma documentação overview geral dessa função aqui. Então, além dos dados, eu poderia, por exemplo colocar aqui qual é o de densidade, se ele acumulativo tá certo? Qual que é o tipo de histograma que pode ser barra? Pode ser outros tipos orientação vertical? Posso trocar isso daqui para a horizontal? Existe uma série de coisas aqui que eu posso trabalhar na transformação logarítmica, entre outras coisas, então aqui. Só que isso daqui diferencia, por exemplo, de um gráfico de barras onde as barras são separadas. Aqui a ideia ser junto mesmo. Então a gente tem umas barras unidas onde a gente só pega o contorno das barras, porque o mais importante para a gente a gente saber aonde a quantidade bate na classe. Então, por exemplo, a gente sabe que na distribuição uniforme aqui de -3, vamos ver assim um pouco pra lá de -3 até quatro. Nós temos uma distribuição que dá aproximadamente no zero, que seria o meio. Então a média, a mediana é a moda aproximadamente dessa distribuição é igual. Se a gente fosse calcular teoricamente falando aqui, então o histograma ele é utilizado para a gente analisar a distribuição estatísticas, para a gente saber se a distribuição é normal de Poisson e assim por diante. Diferente desse gráfico anterior, aqui onde tem outros resultados específicos e as distribuições são várias Poisson normal Bernoulli A binomial tem vários tipos de distribuição que na verdade aqui não interessa qual é o tipo de distribuição. O mais importante é que eu consigo plotar histograma para todas as distribuições possíveis. Então veja que agora trabalhamos com mais duas classes de gráficos, ou seja, entendemos um pouquinho mais onde a gente pode aplicar isso. Só que novamente a relativa o seu problema. Então, se você quiser utilizar isso num contexto econômico ou num contexto, por exemplo, a análise ambiental numa inteligência artificial ou no algoritmo de aprendizado de máquina, isso pode depender muito do que você quer fazer. E aqui tem várias possibilidades. E falando em várias possibilidades, isso pode impactar diretamente com aquilo que você está proposto a fazer. Então estude, procure bastante a aplicação, utilize um recurso gráfico ou a própria programação, como nós vimos, para que esse estudo seja cada vez mais eficaz e que as aplicações se tornem cada vez mais fáceis de.