Trabalhando com representações
gráficas em estatística,
é muito comum nós nos perguntarmos qual
gráfico que eu vou trabalhar, o que é melhor,
qual que a melhor situação, onde é
que eu aplico tais gráficos diferentes,
rosca, pizza, que é o gráfico do setor,
histograma, gráfico de barra,
linha de tendência, polígono de frequência
que vai ser uma junção de gráfico de barra
com linha de tendência,
existem várias coisas onde nós podemos
permear e trabalhar em cima disso.
E, agora, vamos falar de
duas classes de gráficos
comumente utilizadas no meio
estatístico, que é o gráfico de setor,
que nós conhecemos
como gráfico de pizza,
aquele gráfico redondinho onde nós
dividimos, normalmente, por porcentagens
e assim por diante, e também o histograma
que tem a ver com a distribuição estatística,
então eu tenho que calcular
frequência, distribuir isso em barras
e ali ordeno as minhas classes
em ordem crescente
para ver como é que está
a distribuição dos meus dados.
Diz que se os dados se aproximam
de uma distribuição gaussiana,
que nós chamamos
de distribuição normal,
a tendência é que o maior número
de frequência bata ali na média,
é quando nós plotamos
a tendência ali.
Então, vamos analisar um pouquinho
os dois tipos de gráfico
para ver como é que nós
trabalhamos com eles visualmente,
tentamos entender alguma
aplicação e assim por diante.
Então, vem comigo aqui.
Temos aqui a criação, por exemplo,
utilizando a linguagem Python,
de um gráfico de setor, onde nós
definimos valores e rótulos, está certo?
Então, 10 para o A, 20 para o B,
30 para o C, 40 para o D, 50 para o E.
Então, nós dividimos aqui
proporcionalmente.
Veja que o E é maior, porque ele
recebe a maior quantidade aqui.
Então, o gráfico de setor é
comum para nós, por exemplo,
calcularmos em classes as porcentagens deles,
nós colocarmos rótulo e assim por diante.
Então, tem até uma variação
aqui embaixo, por exemplo,
do gráfico de setor
utilizando porcentagens.
Então, nós só mudamos aqui
um parâmetro de autoporcentagem,
onde, aquilo que estava aqui em cima,
eu consiga distribuir em porcentagem.
Então você fala assim: "olha, cinco
grupos analisados grupo A, B, C, D e E,
33,3% representa o grupo
e então ele é a maioria.
Por exemplo, se fosse
quantidade de pessoas, seria a maioria
seguido do grupo D, grupo C, B
e terminando pelo grupo.
Então isso daqui é muito importante.
É um tipo de gráfico bem específico.
Não é legal
a gente trabalhar com muitas subdivisões,
porque ele fica muito poluído.
Mas ele é interessante para a gente
ter noção de densidade aqui
e vê qual que é, por exemplo,
a maior porcentagem.
É muito interessante
a gente utilizar esse gráfico do setor,
porque através dos setores
a gente consegue ver
óbvio que o olho humano, dependendo
se as porcentagens são muito próximas
à área,
visualmente falando, para os nossos olhos
talvez não seja algo tão distinguível
assim.
Ou seja,
a gente não conseguiria diferenciar
duas classes diferentes,
o que pode ser um problema.
Então a gente tem que tomar muito cuidado
com o tipo de gráfico
para não cometer esse tipo de erro.
Então, a diferença é que
esse daqui só tem o âmbito visual.
É legal a gente colocar um rótulo
para a gente ter numericamente
uma noção do que está acontecendo.
E seguindo
aqui nós temos um histograma
aonde a gente pega, por exemplo,
uma distribuição de dados,
onde eu pego aqui
um tipo de distribuição que aqui
eu utilizei,
uma distribuição randômica do tipo normal.
Tá certo, Normal porque distribuição
normal é uma distribuição gaussiana.
Se a gente colocar uma linha de tendência
que ele vai ter uma curva diferenciada.
Se eu fizer, por exemplo,
um PLT ponto plot, por exemplo,
nos dados, chegar aqui,
trabalhar com uma cor vermelha,
por exemplo,
a gente vai trabalhar aqui
com o tipo de distribuição.
Óbvio que agora ele colocou os plots
um pouquinho diferentes propriamente dito
e ele colocou agora numa aleatoriedade,
ele transformou tudo.
Então vou comentar essa linha de código
só pra gente não perder
o que fizemos anteriormente
e vou travar uma aleatoriedade também
para a gente
não sair
com mudanças bruscas no nosso cenário.
Então vou trabalhar aqui com o 42,
por exemplo.
Nós temos aqui uma distribuição
específica.
Isso daqui é uma função
zinha computacional que pode nos ajudar
muito, bastante aqui,
porque a gente tem aqui
algumas possibilidades.
E veja que colocando um cursor
aqui na tela irá aparecer um popup
aonde nós temos aqui uma janelinha
onde ele explica aqui dentro dessa função,
como é que eu poderia trabalhar
alguns parâmetros diferentes.
Ele dá uma documentação
overview geral dessa função aqui.
Então, além dos dados,
eu poderia, por exemplo colocar aqui
qual é o de densidade,
se ele acumulativo tá certo?
Qual que é o tipo de histograma
que pode ser barra?
Pode ser outros tipos orientação vertical?
Posso trocar isso daqui para a horizontal?
Existe uma série de coisas aqui
que eu posso trabalhar na
transformação logarítmica,
entre outras coisas, então aqui.
Só que isso daqui diferencia, por exemplo,
de um gráfico de barras
onde as barras são separadas.
Aqui a ideia ser junto mesmo.
Então a gente tem umas barras unidas onde
a gente só pega o contorno das barras,
porque o mais importante para a gente
a gente saber aonde
a quantidade bate na classe.
Então, por exemplo, a gente sabe que
na distribuição uniforme aqui de -3,
vamos ver assim
um pouco pra lá de -3 até quatro.
Nós temos uma distribuição que dá
aproximadamente no zero, que seria o meio.
Então a média, a mediana é a moda
aproximadamente dessa distribuição é
igual.
Se a gente fosse calcular
teoricamente falando aqui,
então o histograma
ele é utilizado para a gente
analisar a distribuição estatísticas,
para a gente saber se a distribuição
é normal de Poisson e assim por diante.
Diferente desse gráfico anterior, aqui
onde tem outros resultados específicos
e as distribuições são várias
Poisson normal Bernoulli
A binomial
tem vários tipos de distribuição
que na verdade aqui não interessa
qual é o tipo de distribuição.
O mais importante é que
eu consigo plotar histograma
para todas as distribuições possíveis.
Então veja que agora trabalhamos
com mais duas classes de gráficos,
ou seja, entendemos um pouquinho mais
onde a gente pode aplicar isso.
Só que novamente a relativa
o seu problema.
Então, se você quiser utilizar isso
num contexto econômico
ou num contexto, por exemplo,
a análise ambiental
numa inteligência artificial
ou no algoritmo de aprendizado de máquina,
isso pode depender muito
do que você quer fazer.
E aqui tem várias possibilidades.
E falando em várias possibilidades,
isso pode impactar diretamente
com aquilo que você está proposto a fazer.
Então estude,
procure bastante a aplicação,
utilize um recurso gráfico
ou a própria programação, como nós vimos,
para que esse estudo
seja cada vez mais eficaz
e que as aplicações se tornem
cada vez mais fáceis de.