0:00:07.726,0:00:13.133 Constantes, variáveis,[br]números inteiros, flutuantes, 0:00:13.133,0:00:18.652 distribuições, análise combinatória,[br]média, mediana, moda, 0:00:18.652,0:00:24.651 tudo isso envolve um grande[br]conhecimento chamado estatística, 0:00:24.651,0:00:30.320 a matéria que, por causa dela, o mundo[br]mudou a forma de ver as coisas, 0:00:30.320,0:00:35.378 de onde saímos do certo[br]para o cenário probabilístico. 0:00:35.378,0:00:38.481 Meu nome é Matheus Pavani,[br]sou cientista de dados, 0:00:38.481,0:00:42.970 e vamos começar a introduzir esse[br]maravilhoso mundo da estatística. 0:00:42.970,0:00:49.079 Já pararam para pensar quantos números[br]existem entre 0 e 1, por exemplo? 0:00:49.079,0:00:53.850 Dentro dessa métrica nós[br]poderíamos dizer, talvez, alguns, 0:00:53.850,0:00:58.735 ou muitos, milhares, milhões[br]ou até infinitos números. 0:00:58.735,0:01:03.810 Isso porque, entre 0 e 1, existe[br]uma infinidade de possibilidades 0:01:03.810,0:01:08.078 onde nós podemos trabalhar[br]de maneira um pouco mais assertiva. 0:01:08.078,0:01:12.322 Pegue uma régua, por exemplo,[br]entre 0 e 1 centímetro, 0:01:12.322,0:01:21.144 você tem as medidas intermediárias: 0,1,[br]0,2, meio centímetro, 0,8, até chegar no 1. 0:01:21.144,0:01:24.694 Mas e as escalas intermediárias[br]entre esses décimos? 0:01:24.694,0:01:32.999 Não temos uma medida, por exemplo,[br]que diga "0,11", "0,23", "0,37", 0:01:32.999,0:01:35.611 e assim sucessivamente. 0:01:36.623,0:01:42.041 Posto isso, como determinar[br]essa sequência? 0:01:42.041,0:01:45.331 Será que existe algo[br]que eu consiga trabalhar? 0:01:45.331,0:01:49.446 Se existe erro na medida, e essa[br]palavra é muito importante 0:01:49.446,0:01:53.319 porque, no futuro, ela pode[br]nos trazer alguma coisa, 0:01:53.319,0:01:55.503 o que eu devo fazer então? 0:01:55.503,0:01:58.958 E é aqui que a mágica acontece. 0:01:58.958,0:02:03.583 Na verdade, mágica não, e sim[br]o conhecimento de estatística. 0:02:03.583,0:02:08.087 Toda medida possui erro, por exemplo,[br]então, ao pegar uma régua, 0:02:08.087,0:02:13.443 eu nunca vou ter certeza se eu cheguei[br]nos 1,3 centímetros por exemplo, 0:02:13.443,0:02:16.679 pode ser que eu tenha um desvio[br]para mais ou para menos. 0:02:16.679,0:02:20.396 E é aí que, por exemplo, uma medida[br]de desvio padrão pode ajudar. 0:02:20.396,0:02:25.608 O importante nisso tudo, nessa história[br]da régua ou qualquer tipo de medida, 0:02:25.608,0:02:29.629 é que nós saibamos que nós paramos[br]de trabalhar com o cenário certo 0:02:29.629,0:02:33.827 e passamos pelo incerto, e isso é[br]natural na história da humanidade. 0:02:33.827,0:02:39.659 Até mesmo porque, se nós pegarmos,[br]por exemplo, o século XVII, XVIII ou XIX, 0:02:39.659,0:02:45.865 as pessoas acharam que medidas eram[br]absolutas, como o espaço e o próprio tempo, 0:02:45.865,0:02:48.701 e nós sabemos que, conforme[br]a humanidade evoluiu 0:02:48.701,0:02:51.871 e o conhecimento também,[br]essas coisas mudaram. 0:02:51.871,0:02:57.243 E a estatística veio a partir do século[br]XIX, até antecede um pouco, 0:02:57.243,0:03:02.923 mas é a partir desse momento que as coisas[br]começam a mudar no cenário da matemática, 0:03:02.923,0:03:09.789 onde nós começamos a ter precisões,[br]erros, distribuições, desvios, variâncias, 0:03:09.789,0:03:13.292 para que nós tragamos[br]uma possibilidade um pouco maior. 0:03:13.292,0:03:18.064 Então, por exemplo, em astronomia,[br]quando nós vamos medir ali 0:03:18.064,0:03:21.350 talvez o desvio da órbita[br]de um planeta, você fala: 0:03:21.350,0:03:25.740 "ah, o desvio da órbita[br]de Mercúrio pode estar ali 0:03:25.740,0:03:35.648 entre 42.98 arcos segundos por século,[br]mais ou menos 2, por exemplo." 0:03:35.648,0:03:37.583 O que significa esse[br]"mais ou menos 2"? 0:03:37.583,0:03:42.221 Significa que o 42.98[br]é uma certeza, 0:03:42.221,0:03:45.691 mas pode ser que eu tenha um desvio[br]para mais ou para menos. 0:03:45.691,0:03:48.294 Isso não é ruim[br]em nenhuma hipótese, 0:03:48.294,0:03:54.133 isso inclusive nos ajuda a ter mais[br]precisão naquilo que nós estamos falando. 0:03:54.133,0:04:00.272 Posto isso, então, vem comigo aqui na tela[br]que eu vou te mostrar algumas coisas. 0:04:00.272,0:04:04.910 Aqui, estamos em um ambiente online[br]do Google chamado Google Colab, 0:04:04.910,0:04:08.781 onde normalmente nós[br]utilizamos o espaço para código. 0:04:08.781,0:04:12.885 Aqui, ele aceita linguagem Python[br]e outras linguagens também. 0:04:12.885,0:04:17.439 Então, eu consigo trabalhar aqui, por exemplo,[br]numericamente com algumas situações 0:04:17.439,0:04:19.325 e assim por diante. 0:04:19.325,0:04:21.460 Só que, por que entramos[br]nesse ambiente? 0:04:21.460,0:04:26.065 Por que nós vamos começar, um pouquinho,[br]a falar sobre essa introdução à estatística. 0:04:26.065,0:04:30.051 Então, o que é importante nós[br]termos como definição aqui? 0:04:30.051,0:04:40.012 Coisas como o que é variável,[br]por exemplo, o que é uma constante, 0:04:40.012,0:04:45.251 e, dentro desse conceito, nós[br]estabelecermos algumas coisas. 0:04:45.251,0:04:48.996 Por exemplo, quando nós[br]falamos de variável, 0:04:48.996,0:04:51.913 que é muito comum quando nós[br]estamos trabalhando com matemática, 0:04:51.913,0:04:55.794 em estatística, nós temos uma coisa[br]nas variáveis numéricas 0:04:55.794,0:04:59.498 chamada de variáveis[br]discretas e contínuas. 0:04:59.498,0:05:04.160 Ou seja, vou trabalhar com números[br]inteiros ou com números reais, 0:05:04.160,0:05:07.572 que são os números flutuantes,[br]que podem ter um número irracional, 0:05:07.572,0:05:11.371 um número negativo ou um número[br]com dízima periódica, 0:05:11.371,0:05:14.813 um número com dízima[br]não periódica, como o pi, 0:05:14.813,0:05:18.917 número de Euler, número[br]de ouro e assim por diante. 0:05:18.917,0:05:20.753 E, a partir disso, é[br]bom fundamentar, 0:05:20.753,0:05:24.456 porque, em estatística, nós não[br]temos só as variáveis numéricas. 0:05:24.456,0:05:30.682 eu posso ter as variáveis textuais também,[br]as variáveis simbólicas ou categóricas, 0:05:30.682,0:05:34.666 onde essas variáveis categóricas[br]me expressam alguma coisa, 0:05:34.666,0:05:38.737 porque quando você está analisando[br]uma tabela do Excel, por exemplo, 0:05:38.737,0:05:41.925 você não tem só números, às vezes[br]você tem uma coluna de rótulo, 0:05:41.925,0:05:48.013 por exemplo, unidade da federação, onde[br]você vai ter o nome dos estados brasileiros. 0:05:48.013,0:05:50.235 E, aqui, nós temos[br]que entrar no detalhe 0:05:50.235,0:05:55.220 que a forma como você vai trabalhar[br]esse tipo de dado é muito importante, 0:05:55.220,0:05:58.090 porque o trato que você[br]faz com um número 0:05:58.090,0:06:02.761 não é o mesmo que você faz[br]com uma variável categórica, por exemplo. 0:06:02.761,0:06:06.064 Então, aqui são conceitos fundamentais[br]que nós temos que trazer 0:06:06.064,0:06:08.066 para que a sua jornada[br]seja completa. 0:06:08.066,0:06:11.970 Até mesmo porque, dentro[br]desse mundo da estatística, 0:06:11.970,0:06:15.674 existem algumas nuances[br]que nós temos que preservar. 0:06:15.674,0:06:22.080 Dito isso, então, convido[br]você a trazer mais vontade 0:06:22.080,0:06:27.186 para que esse conhecimento possa[br]gerar algumas situações importantes. 0:06:27.186,0:06:34.119 Então, quando nós falamos de variáveis,[br]constantes, nós falamos, por exemplo, 0:06:34.119,0:06:38.927 de constantes de acoplamento, nós[br]estamos falando de uma variável 0:06:38.927,0:06:43.669 que vai fazer jus, por exemplo,[br]a um modelo preditivo, 0:06:43.669,0:06:47.739 tudo isso envolve estatística,[br]tudo isso nasce da base estatística 0:06:47.739,0:06:51.810 e nós não podemos deixar isso[br]passar de maneira alguma. 0:06:51.810,0:06:54.107 Então, volta aqui[br]comigo rapidinho. 0:06:54.107,0:06:58.282 Falando de variáveis e constantes,[br]quando nós falamos de estatística, 0:06:58.282,0:07:01.800 nós também temos outros conceitos[br]que são mais comuns do nosso cotidiano, 0:07:01.800,0:07:05.692 que são, por exemplo,[br]a média, a mediana, 0:07:06.525,0:07:08.260 e a moda, por exemplo. 0:07:08.260,0:07:13.899 Então nós sabemos que se eu tenho[br]um número "x = 1", por exemplo, 0:07:13.899,0:07:20.363 e eu tenho aqui "y = 2", e se eu[br]quiser calcular a média deles dois, 0:07:20.363,0:07:25.610 basta eu vir aqui, vou jogar uma função[br]"print" para nos ajudar a enxergar na tela, 0:07:25.610,0:07:31.816 somo os dois e divido por dois,[br]até mesmo porque nós sabemos 0:07:31.816,0:07:37.783 que a média aritmética de dois[br]elementos são eles dividido por dois, 0:07:37.783,0:07:43.628 então só deixa eu corrigir aqui, colocando[br]um parênteses a mais para nós, 0:07:43.628,0:07:49.167 e nós vamos ver que a média[br]entre 1 e 2 é 1,5, está certo? 0:07:49.167,0:07:55.116 Agora, se nós quiséssemos verificar,[br]por exemplo, a mediana desses dois elementos, 0:07:55.116,0:07:58.168 nós sabemos que a regra[br]para a mediana para números pares 0:07:58.168,0:08:02.180 tem que somar os dois e dividir por dois,[br]então eu vou ter 1,5 também. 0:08:02.180,0:08:07.202 E a moda, na verdade, aqui não se aplica,[br]porque eu não tenho uma situação 0:08:07.202,0:08:10.633 onde, por exemplo, eu posso[br]ter aqui um "z = 2" também, 0:08:10.633,0:08:14.793 para dizer qual é o número que mais[br]se repete, o que, nesse caso aqui, seria o 2. 0:08:14.793,0:08:20.198 Então, trabalhando com dois números,[br]por exemplo, isso aqui não faz sentido. 0:08:20.198,0:08:23.667 Então, aqui, nós começamos[br]a trabalhar com algumas situações 0:08:23.667,0:08:27.002 que possam fazer sentido[br]propriamente dito. 0:08:27.873,0:08:34.960 Dito isso tudo, você agora está começando[br]a ingressar nesse mundo estatístico, 0:08:34.960,0:08:38.950 onde as possibilidades[br]podem acontecer. 0:08:38.950,0:08:44.856 Então, mais do que tudo, sempre lembre[br]que o progresso do estudo é contínuo, 0:08:44.856,0:08:49.338 nós não precisamos ficar[br]antecipando etapas, 0:08:49.338,0:08:52.413 por exemplo, estudar[br]distribuições estatísticas agora 0:08:52.413,0:08:55.033 ou entender melhor algum[br]gráfico complicado. 0:08:55.033,0:08:58.944 O importante é você entender[br]a base com muita cautela. 0:08:58.944,0:09:02.907 E então, o que achou[br]desse conteúdo inicial? 0:09:02.907,0:09:06.611 O que acha de mergulhar[br]nesse conhecimento estatístico? 0:09:06.611,0:09:12.050 Convido você a introduzir o maravilhoso[br]mundo da estatística no seu cotidiano.