< Return to Video

ES CAP02 2024 VA03 GRAFICOS SETOR E HISTOGRAMA

  • 0:08 - 0:13
    Trabalhando com representações
    gráficas em estatística,
  • 0:13 - 0:18
    é muito comum nós nos perguntarmos qual
    gráfico que eu vou trabalhar, o que é melhor,
  • 0:18 - 0:22
    qual que a melhor situação, onde é
    que eu aplico tais gráficos diferentes,
  • 0:22 - 0:28
    rosca, pizza, que é o gráfico do setor,
    histograma, gráfico de barra,
  • 0:28 - 0:34
    linha de tendência, polígono de frequência
    que vai ser uma junção de gráfico de barra
  • 0:34 - 0:35
    com linha de tendência,
  • 0:35 - 0:41
    existem várias coisas onde nós podemos
    permear e trabalhar em cima disso.
  • 0:41 - 0:45
    E, agora, vamos falar de
    duas classes de gráficos
  • 0:45 - 0:48
    comumente utilizadas no meio
    estatístico, que é o gráfico de setor,
  • 0:48 - 0:50
    que nós conhecemos
    como gráfico de pizza,
  • 0:50 - 0:55
    aquele gráfico redondinho onde nós
    dividimos, normalmente, por porcentagens
  • 0:55 - 1:01
    e assim por diante, e também o histograma
    que tem a ver com a distribuição estatística,
  • 1:01 - 1:04
    então eu tenho que calcular
    frequência, distribuir isso em barras
  • 1:04 - 1:09
    e ali ordeno as minhas classes
    em ordem crescente
  • 1:09 - 1:13
    para ver como é que está
    a distribuição dos meus dados.
  • 1:13 - 1:17
    Diz que se os dados se aproximam
    de uma distribuição gaussiana,
  • 1:17 - 1:18
    que nós chamamos
    de distribuição normal,
  • 1:18 - 1:24
    a tendência é que o maior número
    de frequência bata ali na média,
  • 1:24 - 1:26
    é quando nós plotamos
    a tendência ali.
  • 1:26 - 1:29
    Então, vamos analisar um pouquinho
    os dois tipos de gráfico
  • 1:29 - 1:32
    para ver como é que nós
    trabalhamos com eles visualmente,
  • 1:32 - 1:34
    tentamos entender alguma
    aplicação e assim por diante.
  • 1:34 - 1:37
    Então, vem comigo aqui.
  • 1:37 - 1:40
    Temos aqui a criação, por exemplo,
    utilizando a linguagem Python,
  • 1:40 - 1:46
    de um gráfico de setor, onde nós
    definimos valores e rótulos, está certo?
  • 1:46 - 1:52
    Então, 10 para o A, 20 para o B,
    30 para o C, 40 para o D, 50 para o E.
  • 1:52 - 1:54
    Então, nós dividimos aqui
    proporcionalmente.
  • 1:54 - 1:59
    Veja que o E é maior, porque ele
    recebe a maior quantidade aqui.
  • 1:59 - 2:02
    Então, o gráfico de setor é
    comum para nós, por exemplo,
  • 2:02 - 2:08
    calcularmos em classes as porcentagens deles,
    nós colocarmos rótulo e assim por diante.
  • 2:08 - 2:11
    Então, tem até uma variação
    aqui embaixo, por exemplo,
  • 2:11 - 2:16
    do gráfico de setor
    utilizando porcentagens.
  • 2:16 - 2:20
    Então, nós só mudamos aqui
    um parâmetro de autoporcentagem,
  • 2:20 - 2:25
    onde, aquilo que estava aqui em cima,
    eu consiga distribuir em porcentagem.
  • 2:25 - 2:31
    Então você fala assim: "olha, cinco
    grupos analisados grupo A, B, C, D e E,
  • 2:31 - 2:36
    33,3% representa o grupo
    e então ele é a maioria.
  • 2:36 - 2:39
    Por exemplo, se fosse
    quantidade de pessoas, seria a maioria
  • 2:39 - 2:44
    seguido do grupo D, grupo C, B
    e terminando pelo grupo.
  • 2:44 - 2:45
    Então isso daqui é muito importante.
  • 2:45 - 2:47
    É um tipo de gráfico bem específico.
  • 2:47 - 2:48
    Não é legal
  • 2:48 - 2:52
    a gente trabalhar com muitas subdivisões,
    porque ele fica muito poluído.
  • 2:52 - 2:56
    Mas ele é interessante para a gente
    ter noção de densidade aqui
  • 2:56 - 2:59
    e vê qual que é, por exemplo,
    a maior porcentagem.
  • 2:59 - 3:02
    É muito interessante
    a gente utilizar esse gráfico do setor,
  • 3:02 - 3:05
    porque através dos setores
    a gente consegue ver
  • 3:05 - 3:10
    óbvio que o olho humano, dependendo
    se as porcentagens são muito próximas
  • 3:10 - 3:13
    à área,
    visualmente falando, para os nossos olhos
  • 3:13 - 3:17
    talvez não seja algo tão distinguível
    assim.
  • 3:17 - 3:18
    Ou seja,
  • 3:18 - 3:21
    a gente não conseguiria diferenciar
    duas classes diferentes,
  • 3:21 - 3:22
    o que pode ser um problema.
  • 3:22 - 3:24
    Então a gente tem que tomar muito cuidado
  • 3:24 - 3:28
    com o tipo de gráfico
    para não cometer esse tipo de erro.
  • 3:28 - 3:32
    Então, a diferença é que
    esse daqui só tem o âmbito visual.
  • 3:32 - 3:33
    É legal a gente colocar um rótulo
  • 3:33 - 3:38
    para a gente ter numericamente
    uma noção do que está acontecendo.
  • 3:38 - 3:40
    E seguindo
  • 3:40 - 3:43
    aqui nós temos um histograma
    aonde a gente pega, por exemplo,
  • 3:43 - 3:46
    uma distribuição de dados,
  • 3:46 - 3:49
    onde eu pego aqui
    um tipo de distribuição que aqui
  • 3:49 - 3:53
    eu utilizei,
    uma distribuição randômica do tipo normal.
  • 3:53 - 3:57
    Tá certo, Normal porque distribuição
    normal é uma distribuição gaussiana.
  • 3:57 - 4:02
    Se a gente colocar uma linha de tendência
    que ele vai ter uma curva diferenciada.
  • 4:02 - 4:08
    Se eu fizer, por exemplo,
    um PLT ponto plot, por exemplo,
  • 4:08 - 4:10
    nos dados, chegar aqui,
  • 4:10 - 4:15
    trabalhar com uma cor vermelha,
    por exemplo,
  • 4:15 - 4:18
    a gente vai trabalhar aqui
    com o tipo de distribuição.
  • 4:18 - 4:22
    Óbvio que agora ele colocou os plots
    um pouquinho diferentes propriamente dito
  • 4:22 - 4:26
    e ele colocou agora numa aleatoriedade,
    ele transformou tudo.
  • 4:26 - 4:30
    Então vou comentar essa linha de código
    só pra gente não perder
  • 4:31 - 4:35
    o que fizemos anteriormente
    e vou travar uma aleatoriedade também
  • 4:35 - 4:37
    para a gente
  • 4:37 - 4:39
    não sair
  • 4:39 - 4:43
    com mudanças bruscas no nosso cenário.
  • 4:43 - 4:45
    Então vou trabalhar aqui com o 42,
    por exemplo.
  • 4:45 - 4:49
    Nós temos aqui uma distribuição
    específica.
  • 4:49 - 4:52
    Isso daqui é uma função
    zinha computacional que pode nos ajudar
  • 4:52 - 4:57
    muito, bastante aqui,
    porque a gente tem aqui
  • 4:57 - 4:58
    algumas possibilidades.
  • 4:58 - 5:02
    E veja que colocando um cursor
    aqui na tela irá aparecer um popup
  • 5:02 - 5:06
    aonde nós temos aqui uma janelinha
    onde ele explica aqui dentro dessa função,
  • 5:06 - 5:09
    como é que eu poderia trabalhar
    alguns parâmetros diferentes.
  • 5:09 - 5:13
    Ele dá uma documentação
    overview geral dessa função aqui.
  • 5:13 - 5:17
    Então, além dos dados,
    eu poderia, por exemplo colocar aqui
  • 5:17 - 5:22
    qual é o de densidade,
    se ele acumulativo tá certo?
  • 5:22 - 5:24
    Qual que é o tipo de histograma
    que pode ser barra?
  • 5:24 - 5:28
    Pode ser outros tipos orientação vertical?
  • 5:28 - 5:30
    Posso trocar isso daqui para a horizontal?
  • 5:30 - 5:34
    Existe uma série de coisas aqui
    que eu posso trabalhar na
  • 5:34 - 5:36
    transformação logarítmica,
  • 5:36 - 5:39
    entre outras coisas, então aqui.
  • 5:39 - 5:42
    Só que isso daqui diferencia, por exemplo,
  • 5:42 - 5:45
    de um gráfico de barras
    onde as barras são separadas.
  • 5:45 - 5:47
    Aqui a ideia ser junto mesmo.
  • 5:47 - 5:52
    Então a gente tem umas barras unidas onde
    a gente só pega o contorno das barras,
  • 5:52 - 5:55
    porque o mais importante para a gente
    a gente saber aonde
  • 5:55 - 5:58
    a quantidade bate na classe.
  • 5:58 - 6:03
    Então, por exemplo, a gente sabe que
    na distribuição uniforme aqui de -3,
  • 6:03 - 6:07
    vamos ver assim
    um pouco pra lá de -3 até quatro.
  • 6:07 - 6:10
    Nós temos uma distribuição que dá
    aproximadamente no zero, que seria o meio.
  • 6:10 - 6:16
    Então a média, a mediana é a moda
    aproximadamente dessa distribuição é
  • 6:16 - 6:17
    igual.
  • 6:17 - 6:21
    Se a gente fosse calcular
    teoricamente falando aqui,
  • 6:21 - 6:22
    então o histograma
  • 6:22 - 6:26
    ele é utilizado para a gente
    analisar a distribuição estatísticas,
  • 6:26 - 6:30
    para a gente saber se a distribuição
    é normal de Poisson e assim por diante.
  • 6:30 - 6:36
    Diferente desse gráfico anterior, aqui
    onde tem outros resultados específicos
  • 6:36 - 6:38
    e as distribuições são várias
  • 6:38 - 6:42
    Poisson normal Bernoulli
  • 6:42 - 6:45
    A binomial
    tem vários tipos de distribuição
  • 6:45 - 6:49
    que na verdade aqui não interessa
    qual é o tipo de distribuição.
  • 6:49 - 6:50
    O mais importante é que
  • 6:50 - 6:54
    eu consigo plotar histograma
    para todas as distribuições possíveis.
  • 6:54 - 6:58
    Então veja que agora trabalhamos
    com mais duas classes de gráficos,
  • 6:58 - 7:02
    ou seja, entendemos um pouquinho mais
    onde a gente pode aplicar isso.
  • 7:02 - 7:05
    Só que novamente a relativa
    o seu problema.
  • 7:05 - 7:09
    Então, se você quiser utilizar isso
    num contexto econômico
  • 7:09 - 7:12
    ou num contexto, por exemplo,
    a análise ambiental
  • 7:12 - 7:16
    numa inteligência artificial
    ou no algoritmo de aprendizado de máquina,
  • 7:16 - 7:19
    isso pode depender muito
    do que você quer fazer.
  • 7:20 - 7:23
    E aqui tem várias possibilidades.
  • 7:23 - 7:25
    E falando em várias possibilidades,
  • 7:25 - 7:31
    isso pode impactar diretamente
    com aquilo que você está proposto a fazer.
  • 7:31 - 7:35
    Então estude,
    procure bastante a aplicação,
  • 7:35 - 7:39
    utilize um recurso gráfico
    ou a própria programação, como nós vimos,
  • 7:39 - 7:42
    para que esse estudo
    seja cada vez mais eficaz
  • 7:42 - 7:46
    e que as aplicações se tornem
    cada vez mais fáceis de.
Title:
ES CAP02 2024 VA03 GRAFICOS SETOR E HISTOGRAMA
Video Language:
Portuguese, Brazilian
Duration:
07:49

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions