Constantes, variáveis,
números inteiros, flutuantes,
distribuições, análise combinatória,
média, mediana, moda,
tudo isso envolve um grande
conhecimento chamado estatística,
a matéria que, por causa dela, o mundo
mudou a forma de ver as coisas,
de onde saímos do certo
para o cenário probabilístico.
Meu nome é Matheus Pavani,
sou cientista de dados,
e vamos começar a introduzir esse
maravilhoso mundo da estatística.
Já pararam para pensar quantos números
existem entre 0 e 1, por exemplo?
Dentro dessa métrica nós
poderíamos dizer, talvez, alguns,
ou muitos, milhares, milhões
ou até infinitos números.
Isso porque, entre 0 e 1, existe
uma infinidade de possibilidades
onde nós podemos trabalhar
de maneira um pouco mais assertiva.
Pegue uma régua, por exemplo,
entre 0 e 1 centímetro,
você tem as medidas intermediárias: 0,1,
0,2, meio centímetro, 0,8, até chegar no 1.
Mas e as escalas intermediárias
entre esses décimos?
Não temos uma medida, por exemplo,
que diga "0,11", "0,23", "0,37",
e assim sucessivamente.
Posto isso, como determinar
essa sequência?
Será que existe algo
que eu consiga trabalhar?
Se existe erro na medida, e essa
palavra é muito importante
porque, no futuro, ela pode
nos trazer alguma coisa,
o que eu devo fazer então?
E é aqui que a mágica acontece.
Na verdade, mágica não, e sim
o conhecimento de estatística.
Toda medida possui erro, por exemplo,
então, ao pegar uma régua,
eu nunca vou ter certeza se eu cheguei
nos 1,3 centímetros por exemplo,
pode ser que eu tenha um desvio
para mais ou para menos.
E é aí que, por exemplo, uma medida
de desvio padrão pode ajudar.
O importante nisso tudo, nessa história
da régua ou qualquer tipo de medida,
é que nós saibamos que nós paramos
de trabalhar com o cenário certo
e passamos pelo incerto, e isso é
natural na história da humanidade.
Até mesmo porque, se nós pegarmos,
por exemplo, o século XVII, XVIII ou XIX,
as pessoas acharam que medidas eram
absolutas, como o espaço e o próprio tempo,
e nós sabemos que, conforme
a humanidade evoluiu
e o conhecimento também,
essas coisas mudaram.
E a estatística veio a partir do século
XIX, até antecede um pouco,
mas é a partir desse momento que as coisas
começam a mudar no cenário da matemática,
onde nós começamos a ter precisões,
erros, distribuições, desvios, variâncias,
para que nós tragamos
uma possibilidade um pouco maior.
Então, por exemplo, em astronomia,
quando nós vamos medir ali
talvez o desvio da órbita
de um planeta, você fala:
"ah, o desvio da órbita
de Mercúrio pode estar ali
entre 42.98 arcos segundos por século,
mais ou menos 2, por exemplo."
O que significa esse
"mais ou menos 2"?
Significa que o 42.98
é uma certeza,
mas pode ser que eu tenha um desvio
para mais ou para menos.
Isso não é ruim
em nenhuma hipótese,
isso inclusive nos ajuda a ter mais
precisão naquilo que nós estamos falando.
Posto isso, então, vem comigo aqui na tela
que eu vou te mostrar algumas coisas.
Aqui, estamos em um ambiente online
do Google chamado Google Colab,
onde normalmente nós
utilizamos o espaço para código.
Aqui, ele aceita linguagem Python
e outras linguagens também.
Então, eu consigo trabalhar aqui, por exemplo,
numericamente com algumas situações
e assim por diante.
Só que, por que entramos
nesse ambiente?
Por que nós vamos começar, um pouquinho,
a falar sobre essa introdução à estatística.
Então, o que é importante nós
termos como definição aqui?
Coisas como o que é variável,
por exemplo, o que é uma constante,
e, dentro desse conceito, nós
estabelecermos algumas coisas.
Por exemplo, quando nós
falamos de variável,
que é muito comum quando nós
estamos trabalhando com matemática,
em estatística, nós temos uma coisa
nas variáveis numéricas
chamada de variáveis
discretas e contínuas.
Ou seja, vou trabalhar com números
inteiros ou com números reais,
que são os números flutuantes,
que podem ter um número irracional,
um número negativo ou um número
com dízima periódica,
um número com dízima
não periódica, como o pi,
número de Euler, número
de ouro e assim por diante.
E, a partir disso, é
bom fundamentar,
porque, em estatística, nós não
temos só as variáveis numéricas.
eu posso ter as variáveis textuais também,
as variáveis simbólicas ou categóricas,
onde essas variáveis categóricas
me expressam alguma coisa,
porque quando você está analisando
uma tabela do Excel, por exemplo,
você não tem só números, às vezes
você tem uma coluna de rótulo,
por exemplo, unidade da federação, onde
você vai ter o nome dos estados brasileiros.
E, aqui, nós temos
que entrar no detalhe
que a forma como você vai trabalhar
esse tipo de dado é muito importante,
porque o trato que você
faz com um número
não é o mesmo que você faz
com uma variável categórica, por exemplo.
Então, aqui são conceitos fundamentais
que nós temos que trazer
para que a sua jornada
seja completa.
Até mesmo porque, dentro
desse mundo da estatística,
existem algumas nuances
que nós temos que preservar.
Dito isso, então, convido
você a trazer mais vontade
para que esse conhecimento possa
gerar algumas situações importantes.
Então, quando nós falamos de variáveis,
constantes, nós falamos, por exemplo,
de constantes de acoplamento, nós
estamos falando de uma variável
que vai fazer jus, por exemplo,
a um modelo preditivo,
tudo isso envolve estatística,
tudo isso nasce da base estatística
e nós não podemos deixar isso
passar de maneira alguma.
Então, volta aqui
comigo rapidinho.
Falando de variáveis e constantes,
quando nós falamos de estatística,
nós também temos outros conceitos
que são mais comuns do nosso cotidiano,
que são, por exemplo,
a média, a mediana,
e a moda, por exemplo.
Então nós sabemos que se eu tenho
um número "x = 1", por exemplo,
e eu tenho aqui "y = 2", e se eu
quiser calcular a média deles dois,
basta eu vir aqui, vou jogar uma função
"print" para nos ajudar a enxergar na tela,
somo os dois e divido por dois,
até mesmo porque nós sabemos
que a média aritmética de dois
elementos são eles dividido por dois,
então só deixa eu corrigir aqui, colocando
um parênteses a mais para nós,
e nós vamos ver que a média
entre 1 e 2 é 1,5, está certo?
Agora, se nós quiséssemos verificar,
por exemplo, a mediana desses dois elementos,
nós sabemos que a regra
para a mediana para números pares
tem que somar os dois e dividir por dois,
então eu vou ter 1,5 também.
E a moda, na verdade, aqui não se aplica,
porque eu não tenho uma situação
onde, por exemplo, eu posso
ter aqui um "z = 2" também,
para dizer qual é o número que mais
se repete, o que, nesse caso aqui, seria o 2.
Então, trabalhando com dois números,
por exemplo, isso aqui não faz sentido.
Então, aqui, nós começamos
a trabalhar com algumas situações
que possam fazer sentido
propriamente dito.
Dito isso tudo, você agora está começando
a ingressar nesse mundo estatístico,
onde as possibilidades
podem acontecer.
Então, mais do que tudo, sempre lembre
que o progresso do estudo é contínuo,
nós não precisamos ficar
antecipando etapas,
por exemplo, estudar
distribuições estatísticas agora
ou entender melhor algum
gráfico complicado.
O importante é você entender
a base com muita cautela.
E então, o que achou
desse conteúdo inicial?
O que acha de mergulhar
nesse conhecimento estatístico?
Convido você a introduzir o maravilhoso
mundo da estatística no seu cotidiano.