Constantes, variáveis, números inteiros, flutuantes, distribuições, análise combinatória, média, mediana, moda, tudo isso envolve um grande conhecimento chamado estatística, a matéria que, por causa dela, o mundo mudou a forma de ver as coisas, de onde saímos do certo para o cenário probabilístico. Meu nome é Matheus Pavani, sou cientista de dados, e vamos começar a introduzir esse maravilhoso mundo da estatística. Já pararam para pensar quantos números existem entre 0 e 1, por exemplo? Dentro dessa métrica nós poderíamos dizer, talvez, alguns, ou muitos, milhares, milhões ou até infinitos números. Isso porque, entre 0 e 1, existe uma infinidade de possibilidades onde nós podemos trabalhar de maneira um pouco mais assertiva. Pegue uma régua, por exemplo, entre 0 e 1 centímetro, você tem as medidas intermediárias: 0,1, 0,2, meio centímetro, 0,8, até chegar no 1. Mas e as escalas intermediárias entre esses décimos? Não temos uma medida, por exemplo, que diga "0,11", "0,23", "0,37", e assim sucessivamente. Posto isso, como determinar essa sequência? Será que existe algo que eu consiga trabalhar? Se existe erro na medida, e essa palavra é muito importante porque, no futuro, ela pode nos trazer alguma coisa, o que eu devo fazer então? E é aqui que a mágica acontece. Na verdade, mágica não, e sim o conhecimento de estatística. Toda medida possui erro, por exemplo, então, ao pegar uma régua, eu nunca vou ter certeza se eu cheguei nos 1,3 centímetros por exemplo, pode ser que eu tenha um desvio para mais ou para menos. E é aí que, por exemplo, uma medida de desvio padrão pode ajudar. O importante nisso tudo, nessa história da régua ou qualquer tipo de medida, é que nós saibamos que nós paramos de trabalhar com o cenário certo e passamos pelo incerto, e isso é natural na história da humanidade. Até mesmo porque, se nós pegarmos, por exemplo, o século XVII, XVIII ou XIX, as pessoas acharam que medidas eram absolutas, como o espaço e o próprio tempo, e nós sabemos que, conforme a humanidade evoluiu e o conhecimento também, essas coisas mudaram. E a estatística veio a partir do século XIX, até antecede um pouco, mas é a partir desse momento que as coisas começam a mudar no cenário da matemática, onde nós começamos a ter precisões, erros, distribuições, desvios, variâncias, para que nós tragamos uma possibilidade um pouco maior. Então, por exemplo, em astronomia, quando nós vamos medir ali talvez o desvio da órbita de um planeta, você fala: "ah, o desvio da órbita de Mercúrio pode estar ali entre 42.98 arcos segundos por século, mais ou menos 2, por exemplo." O que significa esse "mais ou menos 2"? Significa que o 42.98 é uma certeza, mas pode ser que eu tenha um desvio para mais ou para menos. Isso não é ruim em nenhuma hipótese, isso inclusive nos ajuda a ter mais precisão naquilo que nós estamos falando. Posto isso, então, vem comigo aqui na tela que eu vou te mostrar algumas coisas. Aqui, estamos em um ambiente online do Google chamado Google Colab, onde normalmente nós utilizamos o espaço para código. Aqui, ele aceita linguagem Python e outras linguagens também. Então, eu consigo trabalhar aqui, por exemplo, numericamente com algumas situações e assim por diante. Só que, por que entramos nesse ambiente? Por que nós vamos começar, um pouquinho, a falar sobre essa introdução à estatística. Então, o que é importante nós termos como definição aqui? Coisas como o que é variável, por exemplo, o que é uma constante, e, dentro desse conceito, nós estabelecermos algumas coisas. Por exemplo, quando nós falamos de variável, que é muito comum quando nós estamos trabalhando com matemática, em estatística, nós temos uma coisa nas variáveis numéricas chamada de variáveis discretas e contínuas. Ou seja, vou trabalhar com números inteiros ou com números reais, que são os números flutuantes, que podem ter um número irracional, um número negativo ou um número com dízima periódica, um número com dízima não periódica, como o Pi, número de Euler, número de ouro e assim por diante. E, a partir disso, é bom fundamentar, porque, em estatística, nós não temos só as variáveis numéricas, eu posso ter as variáveis textuais também, as variáveis simbólicas ou categóricas, onde essas variáveis categóricas me expressam alguma coisa, porque quando você está analisando uma tabela do Excel, por exemplo, você não tem só números, às vezes você tem uma coluna de rótulo, por exemplo, "unidade da federação", onde você vai ter o nome dos estados brasileiros. E, aqui, nós temos que entrar no detalhe que a forma como você vai trabalhar esse tipo de dado é muito importante, porque o trato que você faz com um número não é o mesmo que você faz com uma variável categórica, por exemplo. Então, aqui são conceitos fundamentais que nós temos que trazer para que a sua jornada seja completa. Até mesmo porque, dentro desse mundo da estatística, existem algumas nuances que nós temos que preservar. Dito isso, então, convido você a trazer mais vontade para que esse conhecimento possa gerar algumas situações importantes. Então, quando nós falamos de variáveis, constantes, nós falamos, por exemplo, de constantes de acoplamento, nós estamos falando de uma variável que vai fazer jus, por exemplo, a um modelo preditivo, tudo isso envolve estatística, tudo isso nasce da base estatística e nós não podemos deixar isso passar de maneira alguma. Então, volta aqui comigo rapidinho. Falando de variáveis e constantes, quando nós falamos de estatística, nós também temos outros conceitos que são mais comuns do nosso cotidiano, que são, por exemplo, a média, a mediana, e a moda, por exemplo. Então nós sabemos que se eu tenho um número "x = 1", por exemplo, e eu tenho aqui "y = 2", e se eu quiser calcular a média deles dois, basta eu vir aqui, vou jogar uma função "print" para nos ajudar a enxergar na tela, somo os dois e divido por dois, até mesmo porque nós sabemos que a média aritmética de dois elementos são eles dividido por dois. Então, só deixa eu corrigir aqui, colocando um parênteses a mais para nós, e nós vamos ver que a média entre 1 e 2 é 1,5, está certo? Agora, se nós quiséssemos verificar, por exemplo, a mediana desses dois elementos, nós sabemos que a regra para a mediana para números pares tem que somar os dois e dividir por dois, então eu vou ter 1,5 também. E a moda, na verdade, aqui não se aplica, porque eu não tenho uma situação onde, por exemplo, eu posso ter aqui um "z = 2" também, para dizer qual é o número que mais se repete, o que, nesse caso aqui, seria o 2. Então, trabalhando com dois números, por exemplo, isso aqui não faz sentido. Então, aqui, nós começamos a trabalhar com algumas situações que possam fazer sentido propriamente dito. Dito isso tudo, você agora está começando a ingressar nesse mundo estatístico, onde as possibilidades podem acontecer. Então, mais do que tudo, sempre lembre que o progresso do estudo é contínuo, nós não precisamos ficar antecipando etapas, por exemplo, estudar distribuições estatísticas agora ou entender melhor algum gráfico complicado. O importante é você entender a base com muita cautela. E então, o que achou desse conteúdo inicial? O que acha de mergulhar nesse conhecimento estatístico? Convido você a introduzir o maravilhoso mundo da estatística no seu cotidiano.