1 00:00:08,041 --> 00:00:13,313 Constantes, variáveis, números inteiros, flutuantes, 2 00:00:13,313 --> 00:00:18,852 distribuições, análise combinatória, média, mediana, moda, 3 00:00:18,852 --> 00:00:24,891 tudo isso envolve um grande conhecimento chamado estatística, 4 00:00:24,891 --> 00:00:30,530 a matéria que, por causa dela, o mundo mudou a forma de ver as coisas, 5 00:00:30,530 --> 00:00:35,568 de onde saímos do certo para o cenário probabilístico. 6 00:00:35,568 --> 00:00:38,671 Meu nome é Matheus Pavani, sou cientista de dados, 7 00:00:38,671 --> 00:00:43,259 e vamos começar a introduzir esse maravilhoso mundo da estatística. 8 00:00:43,259 --> 00:00:49,249 Já pararam para pensar quantos números existem entre 0 e 1, por exemplo? 9 00:00:49,249 --> 00:00:54,120 Dentro dessa métrica nós poderíamos dizer, talvez, alguns, 10 00:00:54,120 --> 00:00:58,925 ou muitos, milhares, milhões ou até infinitos números. 11 00:00:58,925 --> 00:01:04,030 Isso porque, entre 0 e 1, existe uma infinidade de possibilidades 12 00:01:04,030 --> 00:01:08,268 onde nós podemos trabalhar de maneira um pouco mais assertiva. 13 00:01:08,268 --> 00:01:12,472 Pegue uma régua, por exemplo, entre 0 e 1 centímetro, 14 00:01:12,472 --> 00:01:21,314 você tem as medidas intermediárias: 0,1, 0,2, meio centímetro, 0,8, até chegar no 1. 15 00:01:21,314 --> 00:01:24,884 Mas e as escalas intermediárias entre esses décimos? 16 00:01:24,884 --> 00:01:33,159 Não temos uma medida, por exemplo, que diga "0,11", "0,23", "0,37", 17 00:01:33,159 --> 00:01:36,763 e assim sucessivamente. 18 00:01:36,763 --> 00:01:42,201 Posto isso, como determinar essa sequência? 19 00:01:42,201 --> 00:01:45,471 Será que existe algo que eu consiga trabalhar? 20 00:01:45,471 --> 00:01:49,676 Se existe erro na medida, e essa palavra é muito importante, 21 00:01:49,676 --> 00:01:53,479 porque, no futuro, ela pode nos trazer alguma coisa, 22 00:01:53,479 --> 00:01:56,049 o que eu devo fazer então? 23 00:01:56,049 --> 00:01:59,118 E é aqui que a mágica acontece. 24 00:01:59,118 --> 00:02:03,723 Na verdade, mágica não, e sim o conhecimento de estatística. 25 00:02:03,723 --> 00:02:07,917 Toda medida possui erro, por exemplo, então, ao pegar uma régua, 26 00:02:07,917 --> 00:02:13,633 eu nunca vou ter certeza se eu cheguei nos 1,3 centímetros por exemplo, 27 00:02:13,633 --> 00:02:16,869 pode ser que eu tenha um desvio para mais ou para menos. 28 00:02:16,869 --> 00:02:20,606 E é aí que, por exemplo, uma medida de desvio padrão pode ajudar. 29 00:02:20,606 --> 00:02:25,778 O importante nisso tudo, nessa história da régua ou qualquer tipo de medida, 30 00:02:25,778 --> 00:02:29,849 é que nós saibamos que nós paramos de trabalhar com o cenário certo 31 00:02:29,849 --> 00:02:34,287 e passamos pelo incerto, e isso é natural na história da humanidade. 32 00:02:34,287 --> 00:02:39,659 Até mesmo porque, se nós pegarmos, por exemplo, o século XVII, XVIII ou XIX, 33 00:02:39,659 --> 00:02:45,865 as pessoas acharam que medidas eram absolutas, como o espaço e o próprio tempo, 34 00:02:45,865 --> 00:02:48,701 e nós sabemos que, conforme a humanidade evoluiu 35 00:02:48,701 --> 00:02:51,871 e o conhecimento também, essas coisas mudaram. 36 00:02:51,871 --> 00:02:57,243 E a estatística veio a partir do século XIX, até antecede um pouco, 37 00:02:57,243 --> 00:03:02,923 mas é a partir desse momento que as coisas começam a mudar no cenário da matemática, 38 00:03:02,923 --> 00:03:09,789 onde nós começamos a ter precisões, erros, distribuições, desvios, variâncias, 39 00:03:09,789 --> 00:03:13,292 para que nós tragamos uma possibilidade um pouco maior. 40 00:03:13,292 --> 00:03:18,064 Então, por exemplo, em astronomia, quando nós vamos medir ali 41 00:03:18,064 --> 00:03:21,350 talvez o desvio da órbita de um planeta, você fala: 42 00:03:21,350 --> 00:03:25,740 "ah, o desvio da órbita de Mercúrio pode estar ali 43 00:03:25,740 --> 00:03:35,648 entre 42.98 arcos segundos por século, mais ou menos 2, por exemplo." 44 00:03:35,648 --> 00:03:37,583 O que significa esse "mais ou menos 2"? 45 00:03:37,583 --> 00:03:42,221 Significa que o 42.98 é uma certeza, 46 00:03:42,221 --> 00:03:45,691 mas pode ser que eu tenha um desvio para mais ou para menos. 47 00:03:45,691 --> 00:03:48,294 Isso não é ruim em nenhuma hipótese, 48 00:03:48,294 --> 00:03:54,133 isso inclusive nos ajuda a ter mais precisão naquilo que nós estamos falando. 49 00:03:54,133 --> 00:04:00,272 Posto isso, então, vem comigo aqui na tela que eu vou te mostrar algumas coisas. 50 00:04:00,272 --> 00:04:04,910 Aqui, estamos em um ambiente online do Google chamado Google Colab, 51 00:04:04,910 --> 00:04:08,781 onde normalmente nós utilizamos o espaço para código. 52 00:04:08,781 --> 00:04:12,885 Aqui, ele aceita linguagem Python e outras linguagens também. 53 00:04:12,885 --> 00:04:17,439 Então, eu consigo trabalhar aqui, por exemplo, numericamente com algumas situações 54 00:04:17,439 --> 00:04:19,325 e assim por diante. 55 00:04:19,325 --> 00:04:21,460 Só que, por que entramos nesse ambiente? 56 00:04:21,460 --> 00:04:26,065 Por que nós vamos começar, um pouquinho, a falar sobre essa introdução à estatística. 57 00:04:26,065 --> 00:04:30,051 Então, o que é importante nós termos como definição aqui? 58 00:04:30,051 --> 00:04:40,012 Coisas como o que é variável, por exemplo, o que é uma constante, 59 00:04:40,012 --> 00:04:45,251 e, dentro desse conceito, nós estabelecermos algumas coisas. 60 00:04:45,251 --> 00:04:48,996 Por exemplo, quando nós falamos de variável, 61 00:04:48,996 --> 00:04:51,913 que é muito comum quando nós estamos trabalhando com matemática, 62 00:04:51,913 --> 00:04:55,794 em estatística, nós temos uma coisa nas variáveis numéricas 63 00:04:55,794 --> 00:04:59,498 chamada de variáveis discretas e contínuas. 64 00:04:59,498 --> 00:05:04,160 Ou seja, vou trabalhar com números inteiros ou com números reais, 65 00:05:04,160 --> 00:05:07,572 que são os números flutuantes, que podem ter um número irracional, 66 00:05:07,572 --> 00:05:11,371 um número negativo ou um número com dízima periódica, 67 00:05:11,371 --> 00:05:14,813 um número com dízima não periódica, como o pi, 68 00:05:14,813 --> 00:05:18,917 número de Euler, número de ouro e assim por diante. 69 00:05:18,917 --> 00:05:20,753 E, a partir disso, é bom fundamentar, 70 00:05:20,753 --> 00:05:24,456 porque, em estatística, nós não temos só as variáveis numéricas. 71 00:05:24,456 --> 00:05:30,682 eu posso ter as variáveis textuais também, as variáveis simbólicas ou categóricas, 72 00:05:30,682 --> 00:05:34,666 onde essas variáveis categóricas me expressam alguma coisa, 73 00:05:34,666 --> 00:05:38,737 porque quando você está analisando uma tabela do Excel, por exemplo, 74 00:05:38,737 --> 00:05:41,925 você não tem só números, às vezes você tem uma coluna de rótulo, 75 00:05:41,925 --> 00:05:48,013 por exemplo, unidade da federação, onde você vai ter o nome dos estados brasileiros. 76 00:05:48,013 --> 00:05:50,235 E, aqui, nós temos que entrar no detalhe 77 00:05:50,235 --> 00:05:55,220 que a forma como você vai trabalhar esse tipo de dado é muito importante, 78 00:05:55,220 --> 00:05:58,090 porque o trato que você faz com um número 79 00:05:58,090 --> 00:06:02,761 não é o mesmo que você faz com uma variável categórica, por exemplo. 80 00:06:02,761 --> 00:06:06,064 Então, aqui são conceitos fundamentais que nós temos que trazer 81 00:06:06,064 --> 00:06:08,066 para que a sua jornada seja completa. 82 00:06:08,066 --> 00:06:11,970 Até mesmo porque, dentro desse mundo da estatística, 83 00:06:11,970 --> 00:06:15,674 existem algumas nuances que nós temos que preservar. 84 00:06:15,674 --> 00:06:22,080 Dito isso, então, convido você a trazer mais vontade 85 00:06:22,080 --> 00:06:27,186 para que esse conhecimento possa gerar algumas situações importantes. 86 00:06:27,186 --> 00:06:34,119 Então, quando nós falamos de variáveis, constantes, nós falamos, por exemplo, 87 00:06:34,119 --> 00:06:38,927 de constantes de acoplamento, nós estamos falando de uma variável 88 00:06:38,927 --> 00:06:43,669 que vai fazer jus, por exemplo, a um modelo preditivo, 89 00:06:43,669 --> 00:06:47,739 tudo isso envolve estatística, tudo isso nasce da base estatística 90 00:06:47,739 --> 00:06:51,810 e nós não podemos deixar isso passar de maneira alguma. 91 00:06:51,810 --> 00:06:54,107 Então, volta aqui comigo rapidinho. 92 00:06:54,107 --> 00:06:58,282 Falando de variáveis e constantes, quando nós falamos de estatística, 93 00:06:58,282 --> 00:07:01,800 nós também temos outros conceitos que são mais comuns do nosso cotidiano, 94 00:07:01,800 --> 00:07:05,692 que são, por exemplo, a média, a mediana, 95 00:07:06,525 --> 00:07:08,260 e a moda, por exemplo. 96 00:07:08,260 --> 00:07:13,899 Então nós sabemos que se eu tenho um número "x = 1", por exemplo, 97 00:07:13,899 --> 00:07:20,363 e eu tenho aqui "y = 2", e se eu quiser calcular a média deles dois, 98 00:07:20,363 --> 00:07:25,610 basta eu vir aqui, vou jogar uma função "print" para nos ajudar a enxergar na tela, 99 00:07:25,610 --> 00:07:31,816 somo os dois e divido por dois, até mesmo porque nós sabemos 100 00:07:31,816 --> 00:07:37,783 que a média aritmética de dois elementos são eles dividido por dois, 101 00:07:37,783 --> 00:07:43,628 então só deixa eu corrigir aqui, colocando um parênteses a mais para nós, 102 00:07:43,628 --> 00:07:49,167 e nós vamos ver que a média entre 1 e 2 é 1,5, está certo? 103 00:07:49,167 --> 00:07:55,116 Agora, se nós quiséssemos verificar, por exemplo, a mediana desses dois elementos, 104 00:07:55,116 --> 00:07:58,168 nós sabemos que a regra para a mediana para números pares 105 00:07:58,168 --> 00:08:02,180 tem que somar os dois e dividir por dois, então eu vou ter 1,5 também. 106 00:08:02,180 --> 00:08:07,202 E a moda, na verdade, aqui não se aplica, porque eu não tenho uma situação 107 00:08:07,202 --> 00:08:10,633 onde, por exemplo, eu posso ter aqui um "z = 2" também, 108 00:08:10,633 --> 00:08:14,793 para dizer qual é o número que mais se repete, o que, nesse caso aqui, seria o 2. 109 00:08:14,793 --> 00:08:20,198 Então, trabalhando com dois números, por exemplo, isso aqui não faz sentido. 110 00:08:20,198 --> 00:08:23,667 Então, aqui, nós começamos a trabalhar com algumas situações 111 00:08:23,667 --> 00:08:27,002 que possam fazer sentido propriamente dito. 112 00:08:27,873 --> 00:08:34,960 Dito isso tudo, você agora está começando a ingressar nesse mundo estatístico, 113 00:08:34,960 --> 00:08:38,950 onde as possibilidades podem acontecer. 114 00:08:38,950 --> 00:08:44,856 Então, mais do que tudo, sempre lembre que o progresso do estudo é contínuo, 115 00:08:44,856 --> 00:08:49,338 nós não precisamos ficar antecipando etapas, 116 00:08:49,338 --> 00:08:52,413 por exemplo, estudar distribuições estatísticas agora 117 00:08:52,413 --> 00:08:55,033 ou entender melhor algum gráfico complicado. 118 00:08:55,033 --> 00:08:58,944 O importante é você entender a base com muita cautela. 119 00:08:58,944 --> 00:09:02,907 E então, o que achou desse conteúdo inicial? 120 00:09:02,907 --> 00:09:06,611 O que acha de mergulhar nesse conhecimento estatístico? 121 00:09:06,611 --> 00:09:12,050 Convido você a introduzir o maravilhoso mundo da estatística no seu cotidiano.