-
Trabalhando com representações
gráficas em estatística,
-
é muito comum nós nos perguntarmos qual
gráfico que eu vou trabalhar, o que é melhor,
-
qual que a melhor situação, onde é
que eu aplico tais gráficos diferentes,
-
rosca, pizza, que é o gráfico do setor,
histograma, gráfico de barra,
-
linha de tendência, polígono de frequência
que vai ser uma junção de gráfico de barra
-
com linha de tendência,
-
existem várias coisas onde nós podemos
permear e trabalhar em cima disso.
-
E, agora, vamos falar de
duas classes de gráficos
-
comumente utilizadas no meio
estatístico, que é o gráfico de setor,
-
que nós conhecemos
como gráfico de pizza,
-
aquele gráfico redondinho onde nós
dividimos, normalmente, por porcentagens
-
e assim por diante, e também o histograma
que tem a ver com a distribuição estatística,
-
então eu tenho que calcular
frequência, distribuir isso em barras
-
e ali ordeno as minhas classes
em ordem crescente
-
para ver como é que está
a distribuição dos meus dados.
-
Diz que se os dados se aproximam
de uma distribuição gaussiana,
-
que nós chamamos
de distribuição normal,
-
a tendência é que o maior número
de frequência bata ali na média,
-
é quando nós plotamos
a tendência ali.
-
Então, vamos analisar um pouquinho
os dois tipos de gráfico
-
para ver como é que nós
trabalhamos com eles visualmente,
-
tentamos entender alguma
aplicação e assim por diante.
-
Então, vem comigo aqui.
-
Temos aqui a criação, por exemplo,
utilizando a linguagem Python,
-
de um gráfico de setor, onde nós
definimos valores e rótulos, está certo?
-
Então, 10 para o A, 20 para o B,
30 para o C, 40 para o D, 50 para o E.
-
Então, nós dividimos aqui
proporcionalmente.
-
Veja que o E é maior, porque ele
recebe a maior quantidade aqui.
-
Então, o gráfico de setor é
comum para nós, por exemplo,
-
calcularmos em classes as porcentagens deles,
nós colocarmos rótulo e assim por diante.
-
Então, tem até uma variação
aqui embaixo, por exemplo,
-
do gráfico de setor
utilizando porcentagens.
-
Então, nós só mudamos aqui
um parâmetro de autoporcentagem,
-
onde, aquilo que estava aqui em cima,
eu consiga distribuir em porcentagem.
-
Então você fala assim: "olha, cinco
grupos analisados grupo A, B, C, D e E,
-
33.3% representa o grupo E,
então ele é a maioria,
-
por exemplo, se fosse quantidade
de pessoas, seria a maioria
-
seguido do grupo D, grupo C,
B e terminando pelo grupo A.
-
Então, isso daqui é muito importante,
é um tipo de gráfico bem específico,
-
não é legal nós trabalharmos com muitas
subdivisões, porque ele fica muito poluído,
-
mas ele é interessante para nós
termos noção de densidade aqui
-
e vermos qual que é, por exemplo,
a maior porcentagem.
-
É muito interessante nós
utilizarmos esse gráfico do setor,
-
porque através dos setores
nós conseguimos ver.
-
Óbvio que o olho humano, dependendo
se as porcentagens são muito próximas,
-
a área, visualmente falando
para os nossos olhos,
-
talvez não seja algo
tão distinguível assim.
-
Ou seja, nós não conseguiríamos
diferenciar duas classes diferentes,
-
o que pode ser um problema, então
nós temos que tomar muito cuidado
-
com o tipo de gráfico para não
cometer esse tipo de erro.
-
Então, a diferença é que esse
aqui só tem o âmbito visual,
-
é legal nós colocarmos um rótulo
-
para nós termos numericamente
uma noção do que está acontecendo.
-
E, seguindo, aqui nós temos um histograma
onde nós pegamos, por exemplo,
-
uma distribuição de dados, onde eu
pego aqui um tipo de distribuição,
-
que aqui eu utilizei, uma distribuição
randômica do tipo normal, está certo?
-
Normal por quê?
-
Distribuição normal é
uma distribuição gaussiana,
-
se nós colocarmos uma linha de tendência
aqui, ele vai ter uma curva diferenciada,
-
se eu fizer, por exemplo,
um "plt.plot" nos dados,
-
chegar aqui e trabalhar com uma cor
vermelha, por exemplo,
-
nós vamos trabalhar aqui
com o tipo de distribuição.
-
Óbvio que agora ele colocou os plots
um pouquinho diferentes, propriamente dito,
-
e ele colocou agora em uma aleatoriedade,
ele transformou tudo.
-
Então, eu vou comentar
essa linha de código
-
só para nós não perdermos
o que fizemos anteriormente.
-
Ah, e vou travar
uma aleatoriedade também
-
para nós não sairmos com mudanças
bruscas no nosso cenário.
-
Então, eu vou trabalhar aqui
com o 42, por exemplo,
-
nós temos aqui
uma distribuição específica.
-
Isso aqui é uma funçãozinha computacional
que pode nos ajudar muito, bastante aqui,
-
porque nós temos aqui
algumas possibilidades.
-
E veja que colocando um cursor
aqui na tela irá aparecer um popup
-
aonde nós temos aqui uma janelinha
onde ele explica aqui dentro dessa função,
-
como é que eu poderia trabalhar
alguns parâmetros diferentes.
-
Ele dá uma documentação
overview geral dessa função aqui.
-
Então, além dos dados,
eu poderia, por exemplo colocar aqui
-
qual é o de densidade,
se ele acumulativo tá certo?
-
Qual que é o tipo de histograma
que pode ser barra?
-
Pode ser outros tipos orientação vertical?
-
Posso trocar isso daqui para a horizontal?
-
Existe uma série de coisas aqui
que eu posso trabalhar na
-
transformação logarítmica,
-
entre outras coisas, então aqui.
-
Só que isso daqui diferencia, por exemplo,
-
de um gráfico de barras
onde as barras são separadas.
-
Aqui a ideia ser junto mesmo.
-
Então a gente tem umas barras unidas onde
a gente só pega o contorno das barras,
-
porque o mais importante para a gente
a gente saber aonde
-
a quantidade bate na classe.
-
Então, por exemplo, a gente sabe que
na distribuição uniforme aqui de -3,
-
vamos ver assim
um pouco pra lá de -3 até quatro.
-
Nós temos uma distribuição que dá
aproximadamente no zero, que seria o meio.
-
Então a média, a mediana é a moda
aproximadamente dessa distribuição é
-
igual.
-
Se a gente fosse calcular
teoricamente falando aqui,
-
então o histograma
-
ele é utilizado para a gente
analisar a distribuição estatísticas,
-
para a gente saber se a distribuição
é normal de Poisson e assim por diante.
-
Diferente desse gráfico anterior, aqui
onde tem outros resultados específicos
-
e as distribuições são várias
-
Poisson normal Bernoulli
-
A binomial
tem vários tipos de distribuição
-
que na verdade aqui não interessa
qual é o tipo de distribuição.
-
O mais importante é que
-
eu consigo plotar histograma
para todas as distribuições possíveis.
-
Então veja que agora trabalhamos
com mais duas classes de gráficos,
-
ou seja, entendemos um pouquinho mais
onde a gente pode aplicar isso.
-
Só que novamente a relativa
o seu problema.
-
Então, se você quiser utilizar isso
num contexto econômico
-
ou num contexto, por exemplo,
a análise ambiental
-
numa inteligência artificial
ou no algoritmo de aprendizado de máquina,
-
isso pode depender muito
do que você quer fazer.
-
E aqui tem várias possibilidades.
-
E falando em várias possibilidades,
-
isso pode impactar diretamente
com aquilo que você está proposto a fazer.
-
Então estude,
procure bastante a aplicação,
-
utilize um recurso gráfico
ou a própria programação, como nós vimos,
-
para que esse estudo
seja cada vez mais eficaz
-
e que as aplicações se tornem
cada vez mais fáceis de.