0:00:07.707,0:00:12.681 Trabalhando com representações[br]gráficas em estatística, 0:00:12.681,0:00:17.653 é muito comum nós nos perguntarmos qual[br]gráfico que eu vou trabalhar, o que é melhor, 0:00:17.653,0:00:22.091 qual que a melhor situação, onde é[br]que eu aplico tais gráficos diferentes, 0:00:22.091,0:00:27.904 rosca, pizza, que é o gráfico do setor,[br]histograma, gráfico de barra, 0:00:27.904,0:00:33.698 linha de tendência, polígono de frequência[br]que vai ser uma junção de gráfico de barra 0:00:33.698,0:00:34.772 com linha de tendência, 0:00:34.772,0:00:41.113 existem várias coisas onde nós podemos[br]permear e trabalhar em cima disso. 0:00:41.113,0:00:45.084 E, agora, vamos falar de[br]duas classes de gráficos 0:00:45.084,0:00:48.254 comumente utilizadas no meio[br]estatístico, que é o gráfico de setor, 0:00:48.254,0:00:49.723 que nós conhecemos[br]como gráfico de pizza, 0:00:49.723,0:00:54.712 aquele gráfico redondinho onde nós[br]dividimos, normalmente, por porcentagens 0:00:54.712,0:01:00.501 e assim por diante, e também o histograma[br]que tem a ver com a distribuição estatística, 0:01:00.501,0:01:04.432 então eu tenho que calcular[br]frequência, distribuir isso em barras 0:01:04.432,0:01:09.311 e ali ordeno as minhas classes[br]em ordem crescente 0:01:09.311,0:01:12.916 para ver como é que está[br]a distribuição dos meus dados. 0:01:12.916,0:01:16.620 Diz que se os dados se aproximam[br]de uma distribuição gaussiana, 0:01:16.620,0:01:18.473 que nós chamamos[br]de distribuição normal, 0:01:18.473,0:01:24.071 a tendência é que o maior número[br]de frequência bata ali na média, 0:01:24.071,0:01:26.364 é quando nós plotamos[br]a tendência ali. 0:01:26.364,0:01:29.167 Então, vamos analisar um pouquinho[br]os dois tipos de gráfico 0:01:29.167,0:01:31.952 para ver como é que nós[br]trabalhamos com eles visualmente, 0:01:31.952,0:01:34.216 tentamos entender alguma[br]aplicação e assim por diante. 0:01:34.216,0:01:36.642 Então, vem comigo aqui. 0:01:36.642,0:01:40.413 Temos aqui a criação, por exemplo,[br]utilizando a linguagem Python, 0:01:40.413,0:01:45.553 de um gráfico de setor, onde[br]nós definimos valores e rótulos. 0:01:45.553,0:01:46.020 Está certo? 0:01:46.020,0:01:51.493 Então dez para o ar, 20[br]pro B, 30 pro C, 40 para o D, 50 para o E. 0:01:51.559,0:01:54.396 Então a gente divide aqui proporcional. 0:01:54.396,0:01:58.634 Veja que o é maior[br]porque ele recebe a maior quantidade aqui. 0:01:58.701,0:02:02.038 Então o gráfico de setor,[br]ele é comum para a gente, por exemplo, 0:02:02.038,0:02:03.239 calcular em classes 0:02:03.239,0:02:07.978 as porcentagens deles,[br]a gente colocar rótulo e assim por diante. 0:02:08.078,0:02:11.282 Então tem até uma variação aqui[br]embaixo, por exemplo, 0:02:11.282,0:02:15.854 do gráfico de um setor[br]utilizando porcentagens. 0:02:16.087,0:02:20.159 Então a gente só muda aqui[br]um parâmetro de alto porcentagem, 0:02:20.259,0:02:24.530 aonde aquilo que estava aqui em cima[br]eu consegui distribuir em porcentagem. 0:02:24.530,0:02:28.835 Então você falar assim olha,[br]cinco grupos analisados 0:02:28.868,0:02:35.843 grupo AABCD, E E, 33,3% representa o grupo[br]e então ele é a maioria. 0:02:35.843,0:02:38.846 Por exemplo, se fosse[br]quantidade de pessoas, seria a maioria 0:02:39.047,0:02:43.652 seguido do grupo D, grupo C, B[br]e terminando pelo grupo. 0:02:43.752,0:02:45.421 Então isso daqui é muito importante. 0:02:45.421,0:02:47.389 É um tipo de gráfico bem específico. 0:02:47.389,0:02:48.124 Não é legal 0:02:48.124,0:02:51.928 a gente trabalhar com muitas subdivisões,[br]porque ele fica muito poluído. 0:02:52.028,0:02:55.866 Mas ele é interessante para a gente[br]ter noção de densidade aqui 0:02:55.932,0:02:59.069 e vê qual que é, por exemplo,[br]a maior porcentagem. 0:02:59.069,0:03:01.973 É muito interessante[br]a gente utilizar esse gráfico do setor, 0:03:01.973,0:03:04.976 porque através dos setores[br]a gente consegue ver 0:03:05.143,0:03:10.015 óbvio que o olho humano, dependendo[br]se as porcentagens são muito próximas 0:03:10.115,0:03:12.752 à área,[br]visualmente falando, para os nossos olhos 0:03:12.752,0:03:16.589 talvez não seja algo tão distinguível[br]assim. 0:03:16.689,0:03:17.824 Ou seja, 0:03:17.824,0:03:21.161 a gente não conseguiria diferenciar[br]duas classes diferentes, 0:03:21.161,0:03:22.229 o que pode ser um problema. 0:03:22.229,0:03:24.465 Então a gente tem que tomar muito cuidado 0:03:24.465,0:03:27.835 com o tipo de gráfico[br]para não cometer esse tipo de erro. 0:03:27.935,0:03:31.973 Então, a diferença é que[br]esse daqui só tem o âmbito visual. 0:03:31.973,0:03:33.475 É legal a gente colocar um rótulo 0:03:33.475,0:03:38.214 para a gente ter numericamente[br]uma noção do que está acontecendo. 0:03:38.314,0:03:39.582 E seguindo 0:03:39.582,0:03:42.986 aqui nós temos um histograma[br]aonde a gente pega, por exemplo, 0:03:42.986,0:03:46.223 uma distribuição de dados, 0:03:46.323,0:03:49.393 onde eu pego aqui[br]um tipo de distribuição que aqui 0:03:49.393,0:03:52.764 eu utilizei,[br]uma distribuição randômica do tipo normal. 0:03:52.830,0:03:57.436 Tá certo, Normal porque distribuição[br]normal é uma distribuição gaussiana. 0:03:57.436,0:04:02.007 Se a gente colocar uma linha de tendência[br]que ele vai ter uma curva diferenciada. 0:04:02.174,0:04:07.914 Se eu fizer, por exemplo,[br]um PLT ponto plot, por exemplo, 0:04:07.981,0:04:10.350 nos dados, chegar aqui, 0:04:10.350,0:04:15.122 trabalhar com uma cor vermelha,[br]por exemplo, 0:04:15.222,0:04:18.326 a gente vai trabalhar aqui[br]com o tipo de distribuição. 0:04:18.326,0:04:22.497 Óbvio que agora ele colocou os plots[br]um pouquinho diferentes propriamente dito 0:04:22.497,0:04:26.068 e ele colocou agora numa aleatoriedade,[br]ele transformou tudo. 0:04:26.068,0:04:30.473 Então vou comentar essa linha de código[br]só pra gente não perder 0:04:30.540,0:04:35.178 o que fizemos anteriormente[br]e vou travar uma aleatoriedade também 0:04:35.245,0:04:37.348 para a gente 0:04:37.348,0:04:39.083 não sair 0:04:39.083,0:04:42.553 com mudanças bruscas no nosso cenário. 0:04:42.553,0:04:45.190 Então vou trabalhar aqui com o 42,[br]por exemplo. 0:04:45.190,0:04:48.827 Nós temos aqui uma distribuição[br]específica. 0:04:48.894,0:04:52.264 Isso daqui é uma função[br]zinha computacional que pode nos ajudar 0:04:52.264,0:04:56.903 muito, bastante aqui,[br]porque a gente tem aqui 0:04:56.970,0:04:58.138 algumas possibilidades. 0:04:58.138,0:05:01.942 E veja que colocando um cursor[br]aqui na tela irá aparecer um popup 0:05:02.009,0:05:05.880 aonde nós temos aqui uma janelinha[br]onde ele explica aqui dentro dessa função, 0:05:05.880,0:05:08.616 como é que eu poderia trabalhar[br]alguns parâmetros diferentes. 0:05:08.616,0:05:13.322 Ele dá uma documentação[br]overview geral dessa função aqui. 0:05:13.355,0:05:17.026 Então, além dos dados,[br]eu poderia, por exemplo colocar aqui 0:05:17.026,0:05:21.531 qual é o de densidade,[br]se ele acumulativo tá certo? 0:05:21.531,0:05:24.167 Qual que é o tipo de histograma[br]que pode ser barra? 0:05:24.167,0:05:27.605 Pode ser outros tipos orientação vertical? 0:05:27.638,0:05:30.107 Posso trocar isso daqui para a horizontal? 0:05:30.107,0:05:34.012 Existe uma série de coisas aqui[br]que eu posso trabalhar na 0:05:34.079,0:05:35.814 transformação logarítmica, 0:05:35.814,0:05:39.184 entre outras coisas, então aqui. 0:05:39.284,0:05:41.754 Só que isso daqui diferencia, por exemplo, 0:05:41.754,0:05:44.891 de um gráfico de barras[br]onde as barras são separadas. 0:05:44.891,0:05:46.693 Aqui a ideia ser junto mesmo. 0:05:46.693,0:05:51.565 Então a gente tem umas barras unidas onde[br]a gente só pega o contorno das barras, 0:05:51.665,0:05:54.669 porque o mais importante para a gente[br]a gente saber aonde 0:05:54.835,0:05:57.639 a quantidade bate na classe. 0:05:57.639,0:06:02.711 Então, por exemplo, a gente sabe que[br]na distribuição uniforme aqui de -3, 0:06:02.778,0:06:07.016 vamos ver assim[br]um pouco pra lá de -3 até quatro. 0:06:07.116,0:06:10.320 Nós temos uma distribuição que dá[br]aproximadamente no zero, que seria o meio. 0:06:10.320,0:06:15.793 Então a média, a mediana é a moda[br]aproximadamente dessa distribuição é 0:06:15.859,0:06:17.061 igual. 0:06:17.061,0:06:21.299 Se a gente fosse calcular[br]teoricamente falando aqui, 0:06:21.399,0:06:22.233 então o histograma 0:06:22.233,0:06:25.604 ele é utilizado para a gente[br]analisar a distribuição estatísticas, 0:06:25.604,0:06:29.608 para a gente saber se a distribuição[br]é normal de Poisson e assim por diante. 0:06:29.708,0:06:35.882 Diferente desse gráfico anterior, aqui[br]onde tem outros resultados específicos 0:06:35.982,0:06:38.085 e as distribuições são várias 0:06:38.085,0:06:41.822 Poisson normal Bernoulli 0:06:41.922,0:06:45.326 A binomial[br]tem vários tipos de distribuição 0:06:45.326,0:06:48.630 que na verdade aqui não interessa[br]qual é o tipo de distribuição. 0:06:48.630,0:06:49.731 O mais importante é que 0:06:49.731,0:06:54.169 eu consigo plotar histograma[br]para todas as distribuições possíveis. 0:06:54.236,0:06:57.774 Então veja que agora trabalhamos[br]com mais duas classes de gráficos, 0:06:57.874,0:07:02.379 ou seja, entendemos um pouquinho mais[br]onde a gente pode aplicar isso. 0:07:02.446,0:07:05.215 Só que novamente a relativa[br]o seu problema. 0:07:05.215,0:07:08.953 Então, se você quiser utilizar isso[br]num contexto econômico 0:07:08.953,0:07:12.323 ou num contexto, por exemplo,[br]a análise ambiental 0:07:12.424,0:07:16.495 numa inteligência artificial[br]ou no algoritmo de aprendizado de máquina, 0:07:16.495,0:07:19.498 isso pode depender muito[br]do que você quer fazer. 0:07:19.598,0:07:23.303 E aqui tem várias possibilidades. 0:07:23.369,0:07:25.438 E falando em várias possibilidades, 0:07:25.438,0:07:30.878 isso pode impactar diretamente[br]com aquilo que você está proposto a fazer. 0:07:30.945,0:07:34.816 Então estude,[br]procure bastante a aplicação, 0:07:34.882,0:07:38.520 utilize um recurso gráfico[br]ou a própria programação, como nós vimos, 0:07:38.620,0:07:41.623 para que esse estudo[br]seja cada vez mais eficaz 0:07:41.623,0:07:45.795 e que as aplicações se tornem[br]cada vez mais fáceis de.