-
Trabalhando com representações
gráficas em estatística,
-
é muito comum nós nos perguntarmos qual
gráfico que eu vou trabalhar, o que é melhor,
-
qual que a melhor situação, onde é
que eu aplico tais gráficos diferentes,
-
rosca, pizza, que é o gráfico do setor,
histograma, gráfico de barra,
-
linha de tendência, polígono de frequência
que vai ser uma junção de gráfico de barra
-
com linha de tendência,
-
existem várias coisas onde nós podemos
permear e trabalhar em cima disso.
-
E, agora, vamos falar de
duas classes de gráficos
-
comumente utilizadas no meio
estatístico, que é o gráfico de setor,
-
que nós conhecemos
como gráfico de pizza,
-
aquele gráfico redondinho onde nós
dividimos, normalmente, por porcentagens
-
e assim por diante, e também o histograma
que tem a ver com a distribuição estatística,
-
então eu tenho que calcular
frequência, distribuir isso em barras
-
e ali ordeno as minhas classes
em ordem crescente
-
para ver como é que está
a distribuição dos meus dados.
-
Diz que se os dados se aproximam
de uma distribuição gaussiana,
-
que nós chamamos
de distribuição normal,
-
a tendência é que o maior número
de frequência bata ali na média,
-
é quando nós plotamos
a tendência ali.
-
Então, vamos analisar um pouquinho
os dois tipos de gráfico
-
para ver como é que nós
trabalhamos com eles visualmente,
-
tentamos entender alguma
aplicação e assim por diante.
-
Então, vem comigo aqui.
-
Temos aqui a criação, por exemplo,
utilizando a linguagem Python,
-
de um gráfico de setor, onde nós
definimos valores e rótulos, está certo?
-
Então, 10 para o A, 20 para o B,
30 para o C, 40 para o D, 50 para o E.
-
Então, nós dividimos aqui
proporcionalmente.
-
Veja que o E é maior, porque ele
recebe a maior quantidade aqui.
-
Então, o gráfico de setor é
comum para nós, por exemplo,
-
calcularmos em classes as porcentagens deles,
nós colocarmos rótulo e assim por diante.
-
Então, tem até uma variação
aqui embaixo, por exemplo,
-
do gráfico de setor
utilizando porcentagens.
-
Então, nós só mudamos aqui
um parâmetro de autoporcentagem,
-
onde, aquilo que estava aqui em cima,
eu consiga distribuir em porcentagem.
-
Então você fala assim: "olha, cinco
grupos analisados grupo A, B, C, D e E,
-
33,3% representa o grupo
e então ele é a maioria.
-
Por exemplo, se fosse
quantidade de pessoas, seria a maioria
-
seguido do grupo D, grupo C, B
e terminando pelo grupo.
-
Então isso daqui é muito importante.
-
É um tipo de gráfico bem específico.
-
Não é legal
-
a gente trabalhar com muitas subdivisões,
porque ele fica muito poluído.
-
Mas ele é interessante para a gente
ter noção de densidade aqui
-
e vê qual que é, por exemplo,
a maior porcentagem.
-
É muito interessante
a gente utilizar esse gráfico do setor,
-
porque através dos setores
a gente consegue ver
-
óbvio que o olho humano, dependendo
se as porcentagens são muito próximas
-
à área,
visualmente falando, para os nossos olhos
-
talvez não seja algo tão distinguível
assim.
-
Ou seja,
-
a gente não conseguiria diferenciar
duas classes diferentes,
-
o que pode ser um problema.
-
Então a gente tem que tomar muito cuidado
-
com o tipo de gráfico
para não cometer esse tipo de erro.
-
Então, a diferença é que
esse daqui só tem o âmbito visual.
-
É legal a gente colocar um rótulo
-
para a gente ter numericamente
uma noção do que está acontecendo.
-
E seguindo
-
aqui nós temos um histograma
aonde a gente pega, por exemplo,
-
uma distribuição de dados,
-
onde eu pego aqui
um tipo de distribuição que aqui
-
eu utilizei,
uma distribuição randômica do tipo normal.
-
Tá certo, Normal porque distribuição
normal é uma distribuição gaussiana.
-
Se a gente colocar uma linha de tendência
que ele vai ter uma curva diferenciada.
-
Se eu fizer, por exemplo,
um PLT ponto plot, por exemplo,
-
nos dados, chegar aqui,
-
trabalhar com uma cor vermelha,
por exemplo,
-
a gente vai trabalhar aqui
com o tipo de distribuição.
-
Óbvio que agora ele colocou os plots
um pouquinho diferentes propriamente dito
-
e ele colocou agora numa aleatoriedade,
ele transformou tudo.
-
Então vou comentar essa linha de código
só pra gente não perder
-
o que fizemos anteriormente
e vou travar uma aleatoriedade também
-
para a gente
-
não sair
-
com mudanças bruscas no nosso cenário.
-
Então vou trabalhar aqui com o 42,
por exemplo.
-
Nós temos aqui uma distribuição
específica.
-
Isso daqui é uma função
zinha computacional que pode nos ajudar
-
muito, bastante aqui,
porque a gente tem aqui
-
algumas possibilidades.
-
E veja que colocando um cursor
aqui na tela irá aparecer um popup
-
aonde nós temos aqui uma janelinha
onde ele explica aqui dentro dessa função,
-
como é que eu poderia trabalhar
alguns parâmetros diferentes.
-
Ele dá uma documentação
overview geral dessa função aqui.
-
Então, além dos dados,
eu poderia, por exemplo colocar aqui
-
qual é o de densidade,
se ele acumulativo tá certo?
-
Qual que é o tipo de histograma
que pode ser barra?
-
Pode ser outros tipos orientação vertical?
-
Posso trocar isso daqui para a horizontal?
-
Existe uma série de coisas aqui
que eu posso trabalhar na
-
transformação logarítmica,
-
entre outras coisas, então aqui.
-
Só que isso daqui diferencia, por exemplo,
-
de um gráfico de barras
onde as barras são separadas.
-
Aqui a ideia ser junto mesmo.
-
Então a gente tem umas barras unidas onde
a gente só pega o contorno das barras,
-
porque o mais importante para a gente
a gente saber aonde
-
a quantidade bate na classe.
-
Então, por exemplo, a gente sabe que
na distribuição uniforme aqui de -3,
-
vamos ver assim
um pouco pra lá de -3 até quatro.
-
Nós temos uma distribuição que dá
aproximadamente no zero, que seria o meio.
-
Então a média, a mediana é a moda
aproximadamente dessa distribuição é
-
igual.
-
Se a gente fosse calcular
teoricamente falando aqui,
-
então o histograma
-
ele é utilizado para a gente
analisar a distribuição estatísticas,
-
para a gente saber se a distribuição
é normal de Poisson e assim por diante.
-
Diferente desse gráfico anterior, aqui
onde tem outros resultados específicos
-
e as distribuições são várias
-
Poisson normal Bernoulli
-
A binomial
tem vários tipos de distribuição
-
que na verdade aqui não interessa
qual é o tipo de distribuição.
-
O mais importante é que
-
eu consigo plotar histograma
para todas as distribuições possíveis.
-
Então veja que agora trabalhamos
com mais duas classes de gráficos,
-
ou seja, entendemos um pouquinho mais
onde a gente pode aplicar isso.
-
Só que novamente a relativa
o seu problema.
-
Então, se você quiser utilizar isso
num contexto econômico
-
ou num contexto, por exemplo,
a análise ambiental
-
numa inteligência artificial
ou no algoritmo de aprendizado de máquina,
-
isso pode depender muito
do que você quer fazer.
-
E aqui tem várias possibilidades.
-
E falando em várias possibilidades,
-
isso pode impactar diretamente
com aquilo que você está proposto a fazer.
-
Então estude,
procure bastante a aplicação,
-
utilize um recurso gráfico
ou a própria programação, como nós vimos,
-
para que esse estudo
seja cada vez mais eficaz
-
e que as aplicações se tornem
cada vez mais fáceis de.