< Return to Video

ES CAP02 2024 VA03 GRAFICOS SETOR E HISTOGRAMA

  • 0:08 - 0:12
    Trabalhando com representações
    gráficas em estatística,
  • 0:12 - 0:17
    é muito comum nós nos perguntarmos qual
    gráfico que eu vou trabalhar, o que é melhor,
  • 0:17 - 0:22
    qual que é a melhor situação, onde é
    que eu aplico tais gráficos diferentes,
  • 0:22 - 0:28
    rosca, pizza, que é o gráfico de setor,
    histograma, gráfico de barra,
  • 0:28 - 0:34
    linha de tendência, polígono de frequência,
    que vai ser uma junção de gráfico de barra
  • 0:34 - 0:35
    com linha de tendência,
  • 0:35 - 0:41
    existem várias coisas onde nós podemos
    permear e trabalhar em cima disso.
  • 0:41 - 0:45
    E, agora, vamos falar de
    duas classes de gráficos
  • 0:45 - 0:48
    comumente utilizadas no meio
    estatístico, que é o gráfico de setor,
  • 0:48 - 0:50
    que nós conhecemos
    como gráfico de pizza,
  • 0:50 - 0:55
    aquele gráfico redondinho, onde nós
    dividimos, normalmente, por porcentagens
  • 0:55 - 1:00
    e assim por diante, e também o histograma,
    que tem a ver com a distribuição estatística,
  • 1:00 - 1:05
    então eu tenho que calcular
    a frequência, distribuir isso em barras,
  • 1:05 - 1:09
    e ali ordeno as minhas classes
    em ordem crescente
  • 1:09 - 1:13
    para ver como é que está
    a distribuição dos meus dados.
  • 1:13 - 1:16
    Diz que, se os dados se aproximam
    de uma distribuição gaussiana,
  • 1:16 - 1:19
    que nós chamamos
    de distribuição normal,
  • 1:19 - 1:24
    a tendência é que o maior número
    de frequência bata ali na média,
  • 1:24 - 1:26
    é quando nós plotamos
    a tendência ali.
  • 1:26 - 1:29
    Então, vamos analisar um pouquinho
    os dois tipos de gráfico
  • 1:29 - 1:32
    para ver como é que nós
    trabalhamos com eles visualmente,
  • 1:32 - 1:34
    tentamos entender alguma
    aplicação e assim por diante.
  • 1:34 - 1:36
    Então, vem comigo aqui.
  • 1:36 - 1:40
    Temos aqui a criação, por exemplo,
    utilizando a linguagem Python,
  • 1:40 - 1:46
    de um gráfico de setor, onde nós
    definimos valores e rótulos, está certo?
  • 1:46 - 1:51
    Então, 10 para o A, 20 para o B,
    30 para o C, 40 para o D, 50 para o E.
  • 1:51 - 1:54
    Então, nós dividimos aqui
    proporcionalmente.
  • 1:54 - 1:59
    Veja que o E é maior, porque ele
    recebe a maior quantidade aqui.
  • 1:59 - 2:02
    Então, o gráfico de setor é
    comum para nós, por exemplo,
  • 2:02 - 2:08
    calcularmos em classes as porcentagens deles,
    nós colocarmos rótulo e assim por diante.
  • 2:08 - 2:11
    Então, tem até uma variação
    aqui embaixo, por exemplo,
  • 2:11 - 2:16
    do gráfico de setor
    utilizando porcentagens.
  • 2:16 - 2:20
    Então, nós só mudamos aqui
    um parâmetro de autoporcentagem,
  • 2:20 - 2:24
    onde, aquilo que estava aqui em cima,
    eu consiga distribuir em porcentagem.
  • 2:24 - 2:31
    Então, você fala assim: "olha, cinco
    grupos analisados, grupo A, B, C, D e E,
  • 2:31 - 2:36
    33.3% representam o grupo E",
    então ele é a maioria,
  • 2:36 - 2:39
    por exemplo, se fosse quantidade
    de pessoas, seria a maioria,
  • 2:39 - 2:43
    seguido do grupo D, grupo C,
    B e terminando pelo grupo A.
  • 2:43 - 2:47
    Então, isso aqui é muito importante,
    é um tipo de gráfico bem específico,
  • 2:47 - 2:52
    não é legal nós trabalharmos com muitas
    subdivisões, porque ele fica muito poluído,
  • 2:52 - 2:56
    mas ele é interessante para nós
    termos noção de densidade
  • 2:56 - 2:59
    e vermos qual que é, por exemplo,
    a maior porcentagem.
  • 2:59 - 3:02
    É muito interessante nós
    utilizarmos esse gráfico de setor,
  • 3:02 - 3:05
    porque, através dos setores,
    nós conseguimos ver.
  • 3:05 - 3:10
    Óbvio que o olho humano, dependendo
    se as porcentagens são muito próximas,
  • 3:10 - 3:13
    a área, visualmente falando
    para os nossos olhos,
  • 3:13 - 3:17
    talvez não seja algo
    tão distinguível assim.
  • 3:17 - 3:21
    Ou seja, nós não conseguiríamos
    diferenciar duas classes diferentes,
  • 3:21 - 3:24
    o que pode ser um problema, então
    nós temos que tomar muito cuidado
  • 3:24 - 3:28
    com o tipo de gráfico para não
    cometer esse tipo de erro.
  • 3:28 - 3:32
    Então, a diferença é que esse
    aqui só tem o âmbito visual,
  • 3:32 - 3:33
    é legal nós colocarmos um rótulo
  • 3:33 - 3:38
    para nós termos, numericamente,
    uma noção do que está acontecendo.
  • 3:38 - 3:43
    E, seguindo, aqui nós temos um histograma
    onde nós pegamos, por exemplo,
  • 3:43 - 3:49
    uma distribuição de dados, onde eu
    pego aqui um tipo de distribuição,
  • 3:49 - 3:53
    aqui eu utilizei uma distribuição
    randômica do tipo normal, está certo?
  • 3:53 - 3:55
    Normal por quê?
  • 3:55 - 3:57
    Distribuição normal é
    uma distribuição gaussiana,
  • 3:57 - 4:02
    se nós colocarmos uma linha de tendência
    aqui, ele vai ter uma curva diferenciada,
  • 4:02 - 4:10
    se eu fizer, por exemplo,
    um "plt.plot" nos dados,
  • 4:10 - 4:14
    chegar aqui e trabalhar com uma cor
    vermelha, por exemplo,
  • 4:15 - 4:18
    nós vamos trabalhar aqui
    com um tipo de distribuição.
  • 4:18 - 4:22
    Óbvio que agora ele colocou os plots
    um pouquinho diferentes, propriamente dito,
  • 4:22 - 4:26
    e ele colocou agora em uma aleatoriedade,
    ele transformou tudo.
  • 4:26 - 4:29
    Então, eu vou comentar
    essa linha de código
  • 4:29 - 4:32
    só para nós não perdermos
    o que fizemos anteriormente.
  • 4:32 - 4:35
    Ah, e vou travar
    uma aleatoriedade também
  • 4:35 - 4:42
    para nós não sairmos com mudanças
    bruscas no nosso cenário.
  • 4:42 - 4:45
    Então, eu vou trabalhar aqui
    com o 42, por exemplo,
  • 4:45 - 4:49
    nós temos aqui
    uma distribuição específica.
  • 4:49 - 4:54
    Isso aqui é uma funçãozinha computacional
    que pode nos ajudar muito, bastante,
  • 4:54 - 4:58
    porque nós temos aqui
    algumas possibilidades.
  • 4:58 - 5:02
    E veja que, colocando o cursor
    aqui na tela, apareceu um pop-up,
  • 5:02 - 5:06
    onde nós temos uma janelinha onde
    ele explica, aqui dentro dessa função,
  • 5:06 - 5:08
    como é que eu poderia trabalhar,
    alguns parâmetros diferentes,
  • 5:08 - 5:13
    ele dá uma documentação,
    um overview geral dessa função aqui.
  • 5:13 - 5:17
    Então, além dos dados, eu poderia,
    por exemplo, colocar aqui:
  • 5:17 - 5:21
    qual é o range, densidade,
    se ele é acumulativo, está certo?
  • 5:21 - 5:26
    Qual que é o tipo de histograma, que pode
    ser barra, pode ser outros tipos.
  • 5:26 - 5:30
    A orientação, vertical, eu posso
    trocar isso aqui para a horizontal.
  • 5:30 - 5:34
    Existe uma série de coisas
    aqui que eu posso trabalhar,
  • 5:34 - 5:39
    transformação logarítmica,
    entre outras coisas, então aqui.
  • 5:39 - 5:43
    Só que isso aqui diferencia,
    por exemplo, de um gráfico de barra,
  • 5:43 - 5:45
    onde as barras são separadas.
  • 5:45 - 5:49
    Aqui, a ideia é ser junto mesmo,
    então nós temos umas barras unidas
  • 5:49 - 5:52
    onde nós só pegamos
    o contorno das barras,
  • 5:52 - 5:57
    porque o mais importante para nós é
    sabermos onde a quantidade bate na classe.
  • 5:57 - 6:03
    Então, por exemplo, nós sabemos
    que na distribuição uniforme aqui de -3,
  • 6:03 - 6:07
    vamos ver assim, um pouco
    para lá de -3 até 4,
  • 6:07 - 6:10
    nós temos uma distribuição que dá
    aproximadamente no 0, que seria o meio.
  • 6:10 - 6:15
    Então, a média, a mediana e a moda,
    aproximadamente, dessa distribuição,
  • 6:15 - 6:21
    são iguais, se nós fossemos
    calcular teoricamente falando aqui.
  • 6:21 - 6:25
    Então, o histograma é utilizado para nós
    analisarmos distribuições estatísticas,
  • 6:25 - 6:29
    para nós sabermos se a distribuição é
    normal, de Poisson e assim por diante,
  • 6:29 - 6:35
    diferente desse gráfico anterior aqui
    onde tem outros resultados específicos.
  • 6:35 - 6:42
    E as distribuições são várias,
    Poisson, normal, Bernoulli,
  • 6:42 - 6:45
    binomial, tem vários
    tipos de distribuição
  • 6:45 - 6:49
    e, na verdade, aqui não interessa
    qual é o tipo de distribuição,
  • 6:49 - 6:51
    o mais importante é que eu
    consigo plotar histograma
  • 6:51 - 6:54
    para todas as distribuições possíveis.
  • 6:54 - 6:58
    Então, veja que agora trabalhamos
    com mais duas classes de gráficos,
  • 6:58 - 7:02
    ou seja, entendemos um pouquinho
    mais onde nós podemos aplicar isso.
  • 7:02 - 7:05
    Só que, novamente, é
    relativo ao seu problema.
  • 7:05 - 7:09
    Então, se você quiser utilizar isso
    em um contexto econômico
  • 7:09 - 7:14
    ou em um contexto, por exemplo, de análise
    ambiental, em uma inteligência artificial,
  • 7:14 - 7:16
    em um algoritmo de aprendizado
    de máquina,
  • 7:16 - 7:19
    isso pode depender muito
    do que você quer fazer,
  • 7:19 - 7:23
    e aqui tem várias
    possibilidades.
  • 7:23 - 7:25
    E falando em várias possibilidades,
  • 7:25 - 7:31
    isso pode impactar diretamente
    com aquilo que você é proposto a fazer.
  • 7:31 - 7:36
    Então estude, procure bastante
    aplicação, utilize um recurso gráfico
  • 7:36 - 7:38
    ou a própria programação,
    como nós vimos,
  • 7:38 - 7:41
    para que esse estudo
    seja cada vez mais eficaz
  • 7:41 - 7:46
    e que as aplicações se tornem
    cada vez mais fáceis.
Title:
ES CAP02 2024 VA03 GRAFICOS SETOR E HISTOGRAMA
Video Language:
Portuguese, Brazilian
Duration:
07:49

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions