-
Constantes, variáveis,
números inteiros, flutuantes,
-
distribuições, análise combinatória,
média, mediana, moda,
-
tudo isso envolve um grande
conhecimento chamado estatística,
-
a matéria que, por causa dela, o mundo
mudou a forma de ver as coisas,
-
de onde saímos do certo
para o cenário probabilístico.
-
Meu nome é Matheus Pavani,
sou cientista de dados,
-
e vamos começar a introduzir esse
maravilhoso mundo da estatística.
-
Já pararam para pensar quantos números
existem entre 0 e 1, por exemplo?
-
Dentro dessa métrica nós
poderíamos dizer, talvez, alguns,
-
ou muitos, milhares, milhões
ou até infinitos números.
-
Isso porque, entre 0 e 1, existe
uma infinidade de possibilidades
-
onde nós podemos trabalhar
de maneira um pouco mais assertiva.
-
Pegue uma régua, por exemplo,
entre 0 e 1 centímetro,
-
você tem as medidas intermediárias: 0,1,
0,2, meio centímetro, 0,8, até chegar no 1.
-
Mas e as escalas intermediárias
entre esses décimos?
-
Não temos uma medida, por exemplo,
que diga "0,11", "0,23", "0,37",
-
e assim sucessivamente.
-
Posto isso, como determinar
essa sequência?
-
Será que existe algo
que eu consiga trabalhar?
-
Se existe erro na medida, e essa
palavra é muito importante
-
porque, no futuro, ela pode
nos trazer alguma coisa,
-
o que eu devo fazer então?
-
E é aqui que a mágica acontece.
-
Na verdade, mágica não, e sim
o conhecimento de estatística.
-
Toda medida possui erro, por exemplo,
então, ao pegar uma régua,
-
eu nunca vou ter certeza se eu cheguei
nos 1,3 centímetros por exemplo,
-
pode ser que eu tenha um desvio
para mais ou para menos.
-
E é aí que, por exemplo, uma medida
de desvio padrão pode ajudar.
-
O importante nisso tudo, nessa história
da régua ou qualquer tipo de medida,
-
é que nós saibamos que nós paramos
de trabalhar com o cenário certo
-
e passamos pelo incerto, e isso é
natural na história da humanidade.
-
Até mesmo porque, se nós pegarmos,
por exemplo, o século XVII, XVIII ou XIX,
-
as pessoas acharam que medidas eram
absolutas, como o espaço e o próprio tempo,
-
e nós sabemos que, conforme
a humanidade evoluiu
-
e o conhecimento também,
essas coisas mudaram.
-
E a estatística veio a partir do século
XIX, até antecede um pouco,
-
mas é a partir desse momento que as coisas
começam a mudar no cenário da matemática,
-
onde nós começamos a ter precisões,
erros, distribuições, desvios, variâncias,
-
para que nós tragamos
uma possibilidade um pouco maior.
-
Então, por exemplo, em astronomia,
quando nós vamos medir ali
-
talvez o desvio da órbita
de um planeta, você fala:
-
"ah, o desvio da órbita
de Mercúrio pode estar ali
-
entre 42.98 arcos segundos por século,
mais ou menos 2, por exemplo."
-
O que significa esse
"mais ou menos 2"?
-
Significa que o 42.98
é uma certeza,
-
mas pode ser que eu tenha um desvio
para mais ou para menos.
-
Isso não é ruim
em nenhuma hipótese,
-
isso inclusive nos ajuda a ter mais
precisão naquilo que nós estamos falando.
-
Posto isso, então, vem comigo aqui na tela
que eu vou te mostrar algumas coisas.
-
Aqui, estamos em um ambiente online
do Google chamado Google Colab,
-
onde normalmente nós
utilizamos o espaço para código.
-
Aqui, ele aceita linguagem Python
e outras linguagens também.
-
Então, eu consigo trabalhar aqui, por exemplo,
numericamente com algumas situações
-
e assim por diante.
-
Só que, por que entramos
nesse ambiente?
-
Por que nós vamos começar, um pouquinho,
a falar sobre essa introdução à estatística.
-
Então, o que é importante nós
termos como definição aqui?
-
Coisas como o que é variável,
por exemplo, o que é uma constante,
-
e, dentro desse conceito, nós
estabelecermos algumas coisas.
-
Por exemplo, quando nós
falamos de variável,
-
que é muito comum quando nós
estamos trabalhando com matemática,
-
em estatística, nós temos uma coisa
nas variáveis numéricas
-
chamada de variáveis
discretas e contínuas.
-
Ou seja, vou trabalhar com números
inteiros ou com números reais,
-
que são os números flutuantes,
que podem ter um número irracional,
-
um número negativo ou um número
com dízima periódica,
-
um número com dízima
não periódica, como o Pi,
-
número de Euler, número
de ouro e assim por diante.
-
E, a partir disso, é
bom fundamentar,
-
porque, em estatística, nós não
temos só as variáveis numéricas,
-
eu posso ter as variáveis textuais também,
as variáveis simbólicas ou categóricas,
-
onde essas variáveis categóricas
me expressam alguma coisa,
-
porque quando você está analisando
uma tabela do Excel, por exemplo,
-
você não tem só números, às vezes
você tem uma coluna de rótulo,
-
por exemplo, "unidade da federação", onde
você vai ter o nome dos estados brasileiros.
-
E, aqui, nós temos
que entrar no detalhe
-
que a forma como você vai trabalhar
esse tipo de dado é muito importante,
-
porque o trato que você
faz com um número
-
não é o mesmo que você faz
com uma variável categórica, por exemplo.
-
Então, aqui são conceitos fundamentais
que nós temos que trazer
-
para que a sua jornada
seja completa.
-
Até mesmo porque, dentro
desse mundo da estatística,
-
existem algumas nuances
que nós temos que preservar.
-
Dito isso, então, convido
você a trazer mais vontade
-
para que esse conhecimento possa
gerar algumas situações importantes.
-
Então, quando nós falamos de variáveis,
constantes, nós falamos, por exemplo,
-
de constantes de acoplamento, nós
estamos falando de uma variável
-
que vai fazer jus, por exemplo,
a um modelo preditivo,
-
tudo isso envolve estatística,
tudo isso nasce da base estatística
-
e nós não podemos deixar isso
passar de maneira alguma.
-
Então, volta aqui
comigo rapidinho.
-
Falando de variáveis e constantes,
quando nós falamos de estatística,
-
nós também temos outros conceitos
que são mais comuns do nosso cotidiano,
-
que são, por exemplo,
a média, a mediana,
-
e a moda, por exemplo.
-
Então nós sabemos que se eu tenho
um número "x = 1", por exemplo,
-
e eu tenho aqui "y = 2", e se eu
quiser calcular a média deles dois,
-
basta eu vir aqui, vou jogar uma função
"print" para nos ajudar a enxergar na tela,
-
somo os dois e divido por dois,
até mesmo porque nós sabemos
-
que a média aritmética de dois
elementos são eles dividido por dois,
-
então só deixa eu corrigir aqui, colocando
um parênteses a mais para nós,
-
e nós vamos ver que a média
entre 1 e 2 é 1,5, está certo?
-
Agora, se nós quiséssemos verificar,
por exemplo, a mediana desses dois elementos,
-
nós sabemos que a regra
para a mediana para números pares
-
tem que somar os dois e dividir por dois,
então eu vou ter 1,5 também.
-
E a moda, na verdade, aqui não se aplica,
porque eu não tenho uma situação
-
onde, por exemplo, eu posso
ter aqui um "z = 2" também,
-
para dizer qual é o número que mais
se repete, o que, nesse caso aqui, seria o 2.
-
Então, trabalhando com dois números,
por exemplo, isso aqui não faz sentido.
-
Então, aqui, nós começamos
a trabalhar com algumas situações
-
que possam fazer sentido
propriamente dito.
-
Dito isso tudo, você agora está começando
a ingressar nesse mundo estatístico,
-
onde as possibilidades
podem acontecer.
-
Então, mais do que tudo, sempre lembre
que o progresso do estudo é contínuo,
-
nós não precisamos ficar
antecipando etapas,
-
por exemplo, estudar
distribuições estatísticas agora
-
ou entender melhor algum
gráfico complicado.
-
O importante é você entender
a base com muita cautela.
-
E então, o que achou
desse conteúdo inicial?
-
O que acha de mergulhar
nesse conhecimento estatístico?
-
Convido você a introduzir o maravilhoso
mundo da estatística no seu cotidiano.