[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:07.71,0:00:12.49,Default,,0000,0000,0000,,Trabalhando com representações\Ngráficas em estatística, Dialogue: 0,0:00:12.49,0:00:17.44,Default,,0000,0000,0000,,é muito comum nós nos perguntarmos qual\Ngráfico que eu vou trabalhar, o que é melhor, Dialogue: 0,0:00:17.44,0:00:21.99,Default,,0000,0000,0000,,qual que é a melhor situação, onde é\Nque eu aplico tais gráficos diferentes, Dialogue: 0,0:00:21.99,0:00:27.74,Default,,0000,0000,0000,,rosca, pizza, que é o gráfico de setor,\Nhistograma, gráfico de barra, Dialogue: 0,0:00:27.74,0:00:33.59,Default,,0000,0000,0000,,linha de tendência, polígono de frequência,\Nque vai ser uma junção de gráfico de barra Dialogue: 0,0:00:33.59,0:00:34.56,Default,,0000,0000,0000,,com linha de tendência, Dialogue: 0,0:00:34.56,0:00:40.78,Default,,0000,0000,0000,,existem várias coisas onde nós podemos\Npermear e trabalhar em cima disso. Dialogue: 0,0:00:40.78,0:00:44.88,Default,,0000,0000,0000,,E, agora, vamos falar de\Nduas classes de gráficos Dialogue: 0,0:00:44.88,0:00:48.05,Default,,0000,0000,0000,,comumente utilizadas no meio\Nestatístico, que é o gráfico de setor, Dialogue: 0,0:00:48.05,0:00:49.51,Default,,0000,0000,0000,,que nós conhecemos\Ncomo gráfico de pizza, Dialogue: 0,0:00:49.51,0:00:54.51,Default,,0000,0000,0000,,aquele gráfico redondinho, onde nós\Ndividimos, normalmente, por porcentagens Dialogue: 0,0:00:54.51,0:01:00.26,Default,,0000,0000,0000,,e assim por diante, e também o histograma,\Nque tem a ver com a distribuição estatística, Dialogue: 0,0:01:00.26,0:01:04.76,Default,,0000,0000,0000,,então eu tenho que calcular\Na frequência, distribuir isso em barras, Dialogue: 0,0:01:04.76,0:01:09.14,Default,,0000,0000,0000,,e ali ordeno as minhas classes\Nem ordem crescente Dialogue: 0,0:01:09.14,0:01:12.79,Default,,0000,0000,0000,,para ver como é que está\Na distribuição dos meus dados. Dialogue: 0,0:01:12.79,0:01:16.46,Default,,0000,0000,0000,,Diz que, se os dados se aproximam\Nde uma distribuição gaussiana, Dialogue: 0,0:01:16.46,0:01:18.69,Default,,0000,0000,0000,,que nós chamamos\Nde distribuição normal, Dialogue: 0,0:01:18.69,0:01:23.98,Default,,0000,0000,0000,,a tendência é que o maior número\Nde frequência bata ali na média, Dialogue: 0,0:01:23.98,0:01:26.12,Default,,0000,0000,0000,,é quando nós plotamos\Na tendência ali. Dialogue: 0,0:01:26.12,0:01:28.97,Default,,0000,0000,0000,,Então, vamos analisar um pouquinho\Nos dois tipos de gráfico Dialogue: 0,0:01:28.97,0:01:31.75,Default,,0000,0000,0000,,para ver como é que nós\Ntrabalhamos com eles visualmente, Dialogue: 0,0:01:31.75,0:01:34.16,Default,,0000,0000,0000,,tentamos entender alguma\Naplicação e assim por diante. Dialogue: 0,0:01:34.16,0:01:36.08,Default,,0000,0000,0000,,Então, vem comigo aqui. Dialogue: 0,0:01:36.08,0:01:40.18,Default,,0000,0000,0000,,Temos aqui a criação, por exemplo,\Nutilizando a linguagem Python, Dialogue: 0,0:01:40.18,0:01:45.75,Default,,0000,0000,0000,,de um gráfico de setor, onde nós\Ndefinimos valores e rótulos, está certo? Dialogue: 0,0:01:45.75,0:01:51.36,Default,,0000,0000,0000,,Então, 10 para o A, 20 para o B,\N30 para o C, 40 para o D, 50 para o E. Dialogue: 0,0:01:51.36,0:01:54.24,Default,,0000,0000,0000,,Então, nós dividimos aqui\Nproporcionalmente. Dialogue: 0,0:01:54.24,0:01:58.54,Default,,0000,0000,0000,,Veja que o E é maior, porque ele\Nrecebe a maior quantidade aqui. Dialogue: 0,0:01:58.54,0:02:01.94,Default,,0000,0000,0000,,Então, o gráfico de setor é\Ncomum para nós, por exemplo, Dialogue: 0,0:02:01.94,0:02:07.93,Default,,0000,0000,0000,,calcularmos em classes as porcentagens deles,\Nnós colocarmos rótulo e assim por diante. Dialogue: 0,0:02:07.93,0:02:11.08,Default,,0000,0000,0000,,Então, tem até uma variação\Naqui embaixo, por exemplo, Dialogue: 0,0:02:11.08,0:02:15.89,Default,,0000,0000,0000,,do gráfico de setor\Nutilizando porcentagens. Dialogue: 0,0:02:15.89,0:02:20.05,Default,,0000,0000,0000,,Então, nós só mudamos aqui\Num parâmetro de autoporcentagem, Dialogue: 0,0:02:20.05,0:02:24.23,Default,,0000,0000,0000,,onde, aquilo que estava aqui em cima,\Neu consiga distribuir em porcentagem. Dialogue: 0,0:02:24.23,0:02:31.33,Default,,0000,0000,0000,,Então, você fala assim: "olha, cinco\Ngrupos analisados, grupo A, B, C, D e E, Dialogue: 0,0:02:31.33,0:02:35.68,Default,,0000,0000,0000,,33.3% representam o grupo E",\Nentão ele é a maioria, Dialogue: 0,0:02:35.68,0:02:38.85,Default,,0000,0000,0000,,por exemplo, se fosse quantidade\Nde pessoas, seria a maioria, Dialogue: 0,0:02:38.85,0:02:43.49,Default,,0000,0000,0000,,seguido do grupo D, grupo C,\NB e terminando pelo grupo A. Dialogue: 0,0:02:43.49,0:02:47.20,Default,,0000,0000,0000,,Então, isso aqui é muito importante,\Né um tipo de gráfico bem específico, Dialogue: 0,0:02:47.20,0:02:51.85,Default,,0000,0000,0000,,não é legal nós trabalharmos com muitas\Nsubdivisões, porque ele fica muito poluído, Dialogue: 0,0:02:51.85,0:02:55.71,Default,,0000,0000,0000,,mas ele é interessante para nós\Ntermos noção de densidade Dialogue: 0,0:02:55.71,0:02:58.85,Default,,0000,0000,0000,,e vermos qual que é, por exemplo,\Na maior porcentagem. Dialogue: 0,0:02:58.85,0:03:01.77,Default,,0000,0000,0000,,É muito interessante nós\Nutilizarmos esse gráfico de setor, Dialogue: 0,0:03:01.77,0:03:04.92,Default,,0000,0000,0000,,porque, através dos setores,\Nnós conseguimos ver. Dialogue: 0,0:03:04.92,0:03:09.92,Default,,0000,0000,0000,,Óbvio que o olho humano, dependendo\Nse as porcentagens são muito próximas, Dialogue: 0,0:03:09.92,0:03:12.56,Default,,0000,0000,0000,,a área, visualmente falando\Npara os nossos olhos, Dialogue: 0,0:03:12.56,0:03:16.51,Default,,0000,0000,0000,,talvez não seja algo\Ntão distinguível assim. Dialogue: 0,0:03:16.51,0:03:20.84,Default,,0000,0000,0000,,Ou seja, nós não conseguiríamos\Ndiferenciar duas classes diferentes, Dialogue: 0,0:03:20.84,0:03:24.28,Default,,0000,0000,0000,,o que pode ser um problema, então\Nnós temos que tomar muito cuidado Dialogue: 0,0:03:24.28,0:03:27.76,Default,,0000,0000,0000,,com o tipo de gráfico para não\Ncometer esse tipo de erro. Dialogue: 0,0:03:27.76,0:03:31.73,Default,,0000,0000,0000,,Então, a diferença é que esse\Naqui só tem o âmbito visual, Dialogue: 0,0:03:31.73,0:03:33.26,Default,,0000,0000,0000,,é legal nós colocarmos um rótulo Dialogue: 0,0:03:33.26,0:03:38.05,Default,,0000,0000,0000,,para nós termos, numericamente,\Numa noção do que está acontecendo. Dialogue: 0,0:03:38.05,0:03:42.73,Default,,0000,0000,0000,,E, seguindo, aqui nós temos um histograma\Nonde nós pegamos, por exemplo, Dialogue: 0,0:03:42.73,0:03:48.94,Default,,0000,0000,0000,,uma distribuição de dados, onde eu\Npego aqui um tipo de distribuição, Dialogue: 0,0:03:48.94,0:03:53.22,Default,,0000,0000,0000,,aqui eu utilizei uma distribuição\Nrandômica do tipo normal, está certo? Dialogue: 0,0:03:53.22,0:03:54.71,Default,,0000,0000,0000,,Normal por quê? Dialogue: 0,0:03:54.71,0:03:57.31,Default,,0000,0000,0000,,Distribuição normal é\Numa distribuição gaussiana, Dialogue: 0,0:03:57.31,0:04:01.95,Default,,0000,0000,0000,,se nós colocarmos uma linha de tendência\Naqui, ele vai ter uma curva diferenciada, Dialogue: 0,0:04:01.95,0:04:09.54,Default,,0000,0000,0000,,se eu fizer, por exemplo,\Num "plt.plot" nos dados, Dialogue: 0,0:04:09.54,0:04:13.86,Default,,0000,0000,0000,,chegar aqui e trabalhar com uma cor\Nvermelha, por exemplo, Dialogue: 0,0:04:14.99,0:04:18.12,Default,,0000,0000,0000,,nós vamos trabalhar aqui\Ncom um tipo de distribuição. Dialogue: 0,0:04:18.12,0:04:22.25,Default,,0000,0000,0000,,Óbvio que agora ele colocou os plots\Num pouquinho diferentes, propriamente dito, Dialogue: 0,0:04:22.25,0:04:25.86,Default,,0000,0000,0000,,e ele colocou agora em uma aleatoriedade,\Nele transformou tudo. Dialogue: 0,0:04:25.86,0:04:28.71,Default,,0000,0000,0000,,Então, eu vou comentar\Nessa linha de código Dialogue: 0,0:04:28.71,0:04:31.86,Default,,0000,0000,0000,,só para nós não perdermos\No que fizemos anteriormente. Dialogue: 0,0:04:31.86,0:04:35.06,Default,,0000,0000,0000,,Ah, e vou travar\Numa aleatoriedade também Dialogue: 0,0:04:35.06,0:04:42.38,Default,,0000,0000,0000,,para nós não sairmos com mudanças\Nbruscas no nosso cenário. Dialogue: 0,0:04:42.38,0:04:45.00,Default,,0000,0000,0000,,Então, eu vou trabalhar aqui\Ncom o 42, por exemplo, Dialogue: 0,0:04:45.00,0:04:48.73,Default,,0000,0000,0000,,nós temos aqui\Numa distribuição específica. Dialogue: 0,0:04:48.73,0:04:53.62,Default,,0000,0000,0000,,Isso aqui é uma funçãozinha computacional\Nque pode nos ajudar muito, bastante, Dialogue: 0,0:04:53.62,0:04:57.88,Default,,0000,0000,0000,,porque nós temos aqui\Nalgumas possibilidades. Dialogue: 0,0:04:57.88,0:05:01.86,Default,,0000,0000,0000,,E veja que, colocando o cursor\Naqui na tela, apareceu um pop-up, Dialogue: 0,0:05:01.86,0:05:05.65,Default,,0000,0000,0000,,onde nós temos uma janelinha onde\Nele explica, aqui dentro dessa função, Dialogue: 0,0:05:05.65,0:05:08.42,Default,,0000,0000,0000,,como é que eu poderia trabalhar,\Nalguns parâmetros diferentes, Dialogue: 0,0:05:08.42,0:05:13.14,Default,,0000,0000,0000,,ele dá uma documentação,\Num overview geral dessa função aqui. Dialogue: 0,0:05:13.14,0:05:16.91,Default,,0000,0000,0000,,Então, além dos dados, eu poderia,\Npor exemplo, colocar aqui: Dialogue: 0,0:05:16.91,0:05:21.31,Default,,0000,0000,0000,,qual é o range, densidade,\Nse ele é acumulativo, está certo? Dialogue: 0,0:05:21.31,0:05:25.98,Default,,0000,0000,0000,,Qual que é o tipo de histograma, que pode\Nser barra, pode ser outros tipos. Dialogue: 0,0:05:25.98,0:05:29.95,Default,,0000,0000,0000,,A orientação, vertical, eu posso\Ntrocar isso aqui para a horizontal. Dialogue: 0,0:05:29.95,0:05:33.88,Default,,0000,0000,0000,,Existe uma série de coisas\Naqui que eu posso trabalhar, Dialogue: 0,0:05:33.88,0:05:39.14,Default,,0000,0000,0000,,transformação logarítmica,\Nentre outras coisas, então aqui. Dialogue: 0,0:05:39.14,0:05:43.11,Default,,0000,0000,0000,,Só que isso aqui diferencia,\Npor exemplo, de um gráfico de barra, Dialogue: 0,0:05:43.11,0:05:44.60,Default,,0000,0000,0000,,onde as barras são separadas. Dialogue: 0,0:05:44.60,0:05:48.56,Default,,0000,0000,0000,,Aqui, a ideia é ser junto mesmo,\Nentão nós temos umas barras unidas Dialogue: 0,0:05:48.56,0:05:51.52,Default,,0000,0000,0000,,onde nós só pegamos\No contorno das barras, Dialogue: 0,0:05:51.52,0:05:57.39,Default,,0000,0000,0000,,porque o mais importante para nós é\Nsabermos onde a quantidade bate na classe. Dialogue: 0,0:05:57.39,0:06:02.59,Default,,0000,0000,0000,,Então, por exemplo, nós sabemos\Nque na distribuição uniforme aqui de -3, Dialogue: 0,0:06:02.59,0:06:06.94,Default,,0000,0000,0000,,vamos ver assim, um pouco\Npara lá de -3 até 4, Dialogue: 0,0:06:06.94,0:06:10.15,Default,,0000,0000,0000,,nós temos uma distribuição que dá\Naproximadamente no 0, que seria o meio. Dialogue: 0,0:06:10.15,0:06:15.25,Default,,0000,0000,0000,,Então, a média, a mediana e a moda,\Naproximadamente, dessa distribuição, Dialogue: 0,0:06:15.25,0:06:21.22,Default,,0000,0000,0000,,são iguais, se nós fossemos \Ncalcular teoricamente falando aqui. Dialogue: 0,0:06:21.22,0:06:25.40,Default,,0000,0000,0000,,Então, o histograma é utilizado para nós\Nanalisarmos distribuições estatísticas, Dialogue: 0,0:06:25.40,0:06:29.49,Default,,0000,0000,0000,,para nós sabermos se a distribuição é\Nnormal, de Poisson e assim por diante, Dialogue: 0,0:06:29.49,0:06:35.40,Default,,0000,0000,0000,,diferente desse gráfico anterior aqui\Nonde tem outros resultados específicos. Dialogue: 0,0:06:35.40,0:06:42.26,Default,,0000,0000,0000,,E as distribuições são várias,\NPoisson, normal, Bernoulli, Dialogue: 0,0:06:42.26,0:06:45.09,Default,,0000,0000,0000,,binomial, tem vários\Ntipos de distribuição Dialogue: 0,0:06:45.09,0:06:48.65,Default,,0000,0000,0000,,e, na verdade, aqui não interessa\Nqual é o tipo de distribuição, Dialogue: 0,0:06:48.65,0:06:51.01,Default,,0000,0000,0000,,o mais importante é que eu\Nconsigo plotar histograma Dialogue: 0,0:06:51.01,0:06:54.04,Default,,0000,0000,0000,,para todas as distribuições possíveis. Dialogue: 0,0:06:54.04,0:06:57.65,Default,,0000,0000,0000,,Então, veja que agora trabalhamos\Ncom mais duas classes de gráficos, Dialogue: 0,0:06:57.65,0:07:02.26,Default,,0000,0000,0000,,ou seja, entendemos um pouquinho\Nmais onde nós podemos aplicar isso. Dialogue: 0,0:07:02.26,0:07:05.06,Default,,0000,0000,0000,,Só que, novamente, é\Nrelativo ao seu problema. Dialogue: 0,0:07:05.06,0:07:08.76,Default,,0000,0000,0000,,Então, se você quiser utilizar isso\Nem um contexto econômico Dialogue: 0,0:07:08.76,0:07:14.43,Default,,0000,0000,0000,,ou em um contexto, por exemplo, de análise\Nambiental, em uma inteligência artificial, Dialogue: 0,0:07:14.43,0:07:16.28,Default,,0000,0000,0000,,em um algoritmo de aprendizado\Nde máquina, Dialogue: 0,0:07:16.28,0:07:19.45,Default,,0000,0000,0000,,isso pode depender muito\Ndo que você quer fazer, Dialogue: 0,0:07:19.45,0:07:22.89,Default,,0000,0000,0000,,e aqui tem várias\Npossibilidades. Dialogue: 0,0:07:22.89,0:07:25.30,Default,,0000,0000,0000,,E falando em várias possibilidades, Dialogue: 0,0:07:25.30,0:07:30.74,Default,,0000,0000,0000,,isso pode impactar diretamente\Ncom aquilo que você é proposto a fazer. Dialogue: 0,0:07:30.74,0:07:36.20,Default,,0000,0000,0000,,Então estude, procure bastante\Naplicação, utilize um recurso gráfico Dialogue: 0,0:07:36.20,0:07:38.46,Default,,0000,0000,0000,,ou a própria programação,\Ncomo nós vimos, Dialogue: 0,0:07:38.46,0:07:41.46,Default,,0000,0000,0000,,para que esse estudo\Nseja cada vez mais eficaz Dialogue: 0,0:07:41.46,0:07:45.51,Default,,0000,0000,0000,,e que as aplicações se tornem\Ncada vez mais fáceis.