-
Quando nós organizamos
uma base de dados estatísticos,
-
nós temos o objetivo de obter
o máximo de informações
-
a partir da aplicação de uma série
de ferramentas estatísticas
-
que nos permite extrair
as melhores conclusões
-
desses dados
que foram levantados.
-
Por exemplo, entre as ferramentas
estatísticas que nós utilizamos
-
estão a média aritmética,
a moda, a mediana
-
e um outro tipo
de ferramenta estatística
-
que nós chamamos
de "separatrizes".
-
Vamos verificar, então,
como é que a gente calcula
-
essas separatrizes para
uma determinada base de dados.
-
As separatrizes nada mais são
do que separadores percentuais.
-
Então, nós já conhecemos,
na verdade, um tipo de separatriz,
-
que é a chamada mediana.
-
A mediana é um separador
que garante
-
50% dos dados abaixo desse
valor e 50% dos dados acima,
-
ou seja, a mediana é
um tipo de separatriz,
-
é um tipo de separador
percentual.
-
Entretanto, nós temos formas
de separar a base de dados
-
em outras porcentagens.
-
Por exemplo, nós podemos
dividir a nossa base de dados
-
em quatro faixas
de 25% cada.
-
Então, essas faixas que estão
associadas à porcentagem 25%,
-
ou seja, 1/4, são associadas
a um tipo de separador
-
que nós chamamos de quartil
ou quartis, no plural, por exemplo.
-
Nós também podemos separar
uma base de dados
-
em cinco faixas
de 20% cada.
-
Esse tipo de separação,
esse tipo de separador,
-
nós chamamos de quintil ou,
no plural, nós chamamos de quintis.
-
Além dos quartis e dos quintis,
nós temos também os decis.
-
Os decis dividem a base de dados
em 10 faixas de 10% cada.
-
Então, nós temos essas
10 faixas de 10% cada
-
que são promovidas
por 9 decis.
-
E, ainda, nós temos os percentis,
que são 99 separadores
-
que vão garantir para nós
100 faixas de 1% cada.
-
Esses separadores,
então, essas separatrizes
-
são chamadas de percentis.
-
Para que a gente possa
entender um pouco melhor,
-
vamos ver, então,
uma representação gráfica
-
desses separadores,
ou dessas separatrizes.
-
O primeiro separador,
então, é a mediana,
-
que vai garantir, para nós,
50% dos dados abaixo
-
e 50% dos dados
acima da tal mediana,
-
do valor mediano
da base de dados.
-
Então, a mediana é
um tipo de separador
-
que garante 50%
dos dados abaixo
-
e 50% dos dados
acima do valor mediano.
-
Além da mediana,
nós temos os quartis
-
e no caso são 3 quartis.
-
Esses três separadores
vão garantir para nós
-
4 faixas de 25% cada,
-
e a gente pode dizer o seguinte:
o primeiro quartil garante para nós
-
que 25% dos dados estão abaixo
e 75% dos dados estão acima;
-
o segundo quartil
garante para nós, então,
-
que 50% dos dados estão
abaixo, 50% dos dados acima;
-
e, por último, o terceiro
quartil vai garantir para nós
-
que 75% dos dados estão abaixo
e 25% dos dados estão acima.
-
Por exemplo, se em uma determinada
base de notas de alunos,
-
eu informo que o terceiro quartil
das notas foi, por exemplo,
-
6 pontos, o que eu quero
dizer para os alunos
-
é que 75% das notas
ficaram abaixo dos 6 pontos
-
e 25% das notas ficaram
acima de 6 pontos,
-
isso porque eu disse que o terceiro
quartil das notas foi 6 pontos,
-
perfeito?
-
Se eu digo, por exemplo,
que o primeiro quartil das notas
-
foi 4 pontos, eu quero
dizer com isso
-
que 25% das notas estão
abaixo dos 4 pontos
-
e 75% das notas ficaram
acima dos 4 pontos.
-
Isso porque eu disse, aqui,
que o primeiro quartil é 4 pontos.
-
É dessa forma, então, que nós
vamos aplicando e interpretando
-
esses tipos de separadores
-
ou, chamados em estatística,
separatrizes.
-
Além da mediana e dos quartis,
nós temos também os quintis.
-
Veja que os quintis são
quatro separadores
-
que garantem para nós
5 faixas de 20% cada,
-
de maneira que o primeiro
quintil garante para nós
-
que 20% dos dados estão
abaixo do primeiro quintil
-
e 80% dos dados são maiores,
estão acima do primeiro quintil.
-
E, dessa forma, a gente
segue com esse raciocínio,
-
considerando essas
faixas de 20%.
-
O segundo quintil vai garantir
40% dos dados abaixo
-
e 60% dos dados acima,
-
o terceiro quintil garante
60% abaixo, 40% acima,
-
e o quarto quintil vai garantir
que 80% dos dados estão abaixo
-
e 20% dos dados
estão acima.
-
Nós temos, ainda, os decis:
são 9 separadores
-
que garantem para nós 10 faixas
de 10%, totalizando 100%.
-
E aí, a gente diz, por exemplo,
que o primeiro decil
-
vai garantir para nós que 10%
dos dados estão abaixo desse valor
-
e 90% dos dados estão
acima desse valor.
-
Quando você se refere ao segundo
decil de uma base de dados,
-
o que você quer
dizer com isso
-
é que 20% dos dados
estão abaixo daquele valor
-
e 80% dos dados estão
acima desse valor.
-
E, dessa forma, a gente pode
seguir com esse raciocínio
-
até o decil número 9,
o 9° decil da base de dados,
-
que vai garantir que 90%
dos dados estão abaixo
-
e 10% dos dados
estão acima.
-
É importante a gente
notar que, realmente,
-
nós temos algumas
coincidências,
-
por exemplo, a mediana
da base de dados
-
coincide com o segundo quartil,
que coincide com o quinto decil.
-
Se você reparar, o quinto decil
vai deixar 50% dos dados abaixo,
-
50% dos dados acima,
o que equivale à mediana
-
e equivale ao segundo
quartil, por exemplo.
-
Essas equivalências acontecem
em outras situações,
-
por exemplo, o sexto decil
coincide com o terceiro quintil,
-
entre outras situações.
-
Além dos decis, nós
ainda temos os percentis,
-
são 99 separadores
que vão garantir para nós
-
100 faixas de 1% cada,
totalizando 100%.
-
E, então, quando você diz,
em uma certa pesquisa,
-
que o segundo percentil
é um determinado valor,
-
você quer dizer que 2%
dos dados estão abaixo
-
e 98% dos dados
estão acima.
-
Quando você diz
que, em uma pesquisa,
-
o 99° percentil é
um determinado valor,
-
você está dizendo que 99% dos dados
estão abaixo daquele valor
-
e apenas 1% dos dados
estão acima daquele valor.
-
Vamos ver, então, como é que
a gente calcula esses separadores,
-
essas separatrizes.
-
Para projetar, então,
uma determinada separatriz,
-
inicialmente, nós vamos
organizar uma tabela auxiliar
-
com frequências absolutas,
frequências acumuladas
-
e uma coluna de ordenação
na fila de dados.
-
Em seguida, a gente
considera "N"
-
como sendo o total de elementos
da nossa base de dados,
-
e aí nós vamos utilizar
um percentual
-
que está abaixo
da separatriz
-
para multiplicar pelo
total de elementos.
-
Esse percentual que fica
abaixo da separatriz,
-
a gente chama de coeficiente
da separatriz, "Cs".
-
E, com esse cálculo aqui, nós
conseguimos definir, justamente,
-
qual é a classe que nós
vamos usar como apoio,
-
como referência para aplicar
essa formulinha aqui,
-
esse modelo matemático,
que é uma regrinha de 3
-
que já está aqui
organizada para nós,
-
para facilitar a projeção
da separatriz
-
que nós pretendemos
calcular.
-
A letra "S" aqui na fórmula é
uma sigla genérica de separatriz,
-
Quando nós vamos
fazer os cálculos,
-
nós podemos especificar
que separatriz é essa,
-
se é quartil, quintil, decil,
percentil, por exemplo.
-
E os demais valores aqui, então,
com as suas respectivas siglas
-
e significados, são utilizados
como apoio para projetar,
-
para calcular o separador
que nos interessa.
-
Vamos ver, então,
um exemplo, de fato, aqui,
-
onde a gente aplica
essas fórmulas
-
ou essas observações que nós
acabamos de ver aqui.
-
Nesse exemplo aqui,
nós temos uma tabela
-
com uma variedade
de salários mensais brutos,
-
organizados em faixas salariais.
-
Aqui, nós temos as respectivas
quantidades de pessoas
-
associadas às faixas salariais.
-
Então, temos uma amostra
de 135 pessoas
-
e, por exemplo, aqui temos 23 pessoas
que recebem salários variados,
-
entretanto, cada uma dessas
pessoas recebe um salário
-
na faixa de R$ 4.200 a R$ 5.400.
-
Veja que cada uma delas
recebe um salário
-
que fica dentro dessa faixa, essa
que é a interpretação, perfeito?
-
Isso vale para cada um dos valores
que nós estamos vendo aqui na tabela.
-
Aproveitando essa tabela
que foi apresentada aqui,
-
vamos calcular, então,
o primeiro quartil salarial
-
dessa base de dados,
dessa tabela.
-
Para isso, nós vamos
utilizar o Excel como apoio
-
e verificar como fica esse
cálculo passo a passo.
-
Considerando, então, a tabela
que foi dada aqui para nós,
-
eu já deixei aqui uma imagem
com a fórmula que será aplicada,
-
que foi apresentada
ali no PowerPoint,
-
e, aqui, eu já comecei
a fazer essa tabela auxiliar.
-
Na primeira etapa,
-
eu já fui digitando
as classes que foram dadas,
-
agora eu vou informar
as frequências absolutas
-
que são essas quantidades
de funcionários aqui,
-
nós podemos observar que são
26, 32, 23, 18, 14, 11, 7 e 4,
-
aqui eu vou fazer a soma
de todos esses valores
-
e o somatório desses
valores é 135,
-
como a gente pode
observar ali na tabela.
-
Então, veja que, praticamente,
eu acabei copiando a tabela.
-
Agora, eu vou organizar, aqui,
as frequências acumuladas.
-
A primeira frequência
acumulada coincide
-
com a primeira frequência
absoluta, então aqui é 26.
-
A segunda frequência acumulada
vai ser a soma das duas primeiras,
-
é 26 + 32, 58.
-
Agora, a terceira
frequência acumulada
-
é a soma das três primeiras
frequências absolutas.
-
Aqui no Excel, eu posso
até clicar nas células,
-
assim o Excel vai somar
para mim esses três valores,
-
em vez de ficar digitando aqui,
posso usar esse recurso.
-
A soma é 81.
-
Então, agora eu vou continuar
com essa linha de raciocínio,
-
para achar a quarta
frequência acumulada,
-
eu vou somar a primeira absoluta,
mais a segunda absoluta,
-
mais a terceira absoluta, mais
a quarta frequência absoluta,
-
chegando aqui em 99.
-
Para calcular a quinta
frequência acumulada,
-
nós vamos fazer a soma dessas
frequências absolutas aqui.
-
Então, podemos fazer
o 26 somado com o 32,
-
somado com o 23, somado
com o 18, somado com o 14,
-
o resultado aqui, 113.
-
Vamos seguir com esse
raciocínio aqui,
-
calculando a sexta
frequência acumulada,
-
nesse caso, eu vou fazer
26 + 32 + 23 + 18 + 14 + 11,
-
vamos obter, aqui, a sétima
frequência acumulada,
-
então, aqui, eu vou fazer
26 + 32 + 23 + 18 + 14 + 11 + 7,
-
e, agora, por último, eu vou obter
a oitava frequência acumulada,
-
somando 26 + 32 + 23
+ 18 + 14 + 11 + 7 + 4,
-
totalizando aqui 135.
-
Realmente, a nossa expectativa é
que a última frequência acumulada
-
conhecida com o somatório
das frequências absolutas,
-
realmente essa igualdade
deve sempre ocorrer.
-
Vamos obter aqui, agora,
-
essa coluna auxiliar
de ordenação na fila de dados.
-
O que nós queremos dizer
é que essas 26 pessoas,
-
que ganham entre R$ 1.800
e R$ 3.000 mensais brutos,
-
estão em uma fila
de 135 pessoas,
-
e, nessa fila, como elas são
as 26 primeiras pessoas,
-
elas vão da 1ª posição
até a 26ª posição.
-
Agora, como parou na 26ª posição,
aqui começa na 27ª posição
-
e vai até a 58ª posição,
-
que é a frequência acumulada
que nós encontramos aqui.
-
O que nós queremos dizer
com essa faixa de ordenação
-
é que essas 32 pessoas que ganham
de R$ 3.000 a R$ 4.200
-
estão em uma fila, essas 32 pessoas
estão em uma fila de 135 pessoas.
-
Qual é o local, qual é
a posição dessas 32 pessoas
-
na fila de 135 pessoas?
-
Veja, essas 32 pessoas
ficam posicionadas aqui,
-
da 27ª posição
até a 58ª posição.
-
Como eu descobri
que essas 32 pessoas
-
estão nessa posição
na fila de 135 pessoas?
-
Foi fácil, veja.
-
Como aqui nós
temos 26 elementos,
-
então eu já entendo que vai
da 1ª à 26ª posição, para começar.
-
Então, como parou na 26ª
posição, começa na 27ª,
-
foi assim que eu
cheguei no 27 aqui,
-
e eu sei que termina
na frequência acumulada 58.
-
Vamos, então, prosseguir
com esse raciocínio
-
para completar essa
coluna de ordenação.
-
Para projetar o primeiro quartil,
-
uma vez que nós já temos
essa tabela organizada,
-
inicialmente, nós
vamos lembrar, então,
-
que os quartis são
esses separadores
-
que vão garantir para nós
quatro faixas de 25%.
-
Então, o primeiro quartil
garante 25% dos dados abaixo
-
e 75% dos dados acima.
-
Portanto, nós vamos começar,
aqui, calculando 25%
-
do total de elementos que nós
temos aqui na base de dados,
-
que é o 135.
-
Então, ao fazer essa conta aqui,
ao fazer 25% vezes o 135,
-
nós vamos chegar
aqui em 33,75.
-
Agora, esse valor aqui
-
nós vamos aproximar para
o próximo número inteiro.
-
O próximo número inteiro que vem
logo após o 33,75 é o 34.
-
Esse 34 aqui é o 34º
elemento da fila de dados.
-
E aí, nós vamos
verificar aqui agora,
-
com o apoio dessa
coluna de ordenação,
-
qual é a faixa que está
associada a essa posição.
-
Veja que o 34º elemento da fila
está nessa posição aqui,
-
entre a 27ª posição
e a 58ª posição.
-
Portanto, a classe associada a essa
posição é a classe "[3000, 4200[".
-
Então, eu vou copiar essa
classe, "[3000, 4200["
-
e nós dizemos que essa aqui
é a classe que será utilizada
-
como apoio para
a aplicação da fórmula.
-
Vou trazer, aqui, essa
imagem da fórmula, então,
-
para que a gente
possa, agora sim,
-
calcular o primeiro quartil
da base de dados.
-
O primeiro quartil é representado
por essa sigla aqui, "Q1",
-
é o quartil número 1.
-
Se você quiser
deixar o 1 subscrito,
-
você pode vir aqui em "fonte",
aqui em "subscrito",
-
e ele fica nessa
forma de índice.
-
Agora, nessa célula, eu vou fazer
então o cálculo da separatriz,
-
que é o quartil
que nos interessa.
-
Para calcular a separatriz,
-
nós vamos ter que fazer o limite
inferior da classe, que é o 3.000,
-
somado com, aplicando
aqui a fórmula, Cs vezes N.
-
Veja só, o Cs é o coeficiente
da separatriz,
-
é a porcentagem que fica abaixo
do primeiro quartil, ou seja, é 25%.
-
Na forma decimal é 0,25.
-
Eu vou multiplicar isso aqui pelo
N, maiúsculo aqui na fórmula,
-
que é o total de elementos,
que é o 135,
-
vou descontar a frequência
acumulada anterior a essa classe,
-
veja que a classe
"[3200, 4200["
-
tem frequência
acumulada anterior "26".
-
E, em seguida, eu vou
multiplicar isso aqui
-
pela amplitude
da classe, que é o "h",
-
a amplitude é 4.200 - 3.000,
1.200 de amplitude.
-
E ainda vou dividir isso aqui pela
frequência absoluta dessa classe.
-
A classe "[3000, 4200["
tem frequência absoluta 32,
-
então eu vou dividir aqui por 32,
é esse "f" minúsculo aqui,
-
é a frequência absoluta
da classe em questão.
-
Agora, eu vou dar
um enter aqui
-
para a gente ver o resultado
dessa continha, então.
-
Veja que esse valor
aqui é o salário
-
que representa
o primeiro quartil salarial.
-
Se você quiser, ainda,
-
você pode clicar com o lado
direito do mouse aqui,
-
pedir para formatar célula
e, aqui na opção "número",
-
você pode deixar como moeda
corrente valores em reais.
-
Aqui mais abaixo, é possível
a gente selecionar
-
o tipo de moeda
que nos interessa.
-
Vamos localizar, então,
aqui, os valores em reais
-
e, dessa forma, o primeiro quartil
salarial é o salário de R$ 3.290,63.
-
Isso significa que 25% das pessoas
recebem menos do que esse valor
-
e 75% das pessoas
recebem acima desse valor.
-
É dessa forma que a gente projeta,
então, o primeiro quartil salarial.
-
Vamos ver, então,
um outro exemplo,
-
onde a gente calcula
o terceiro quartil salarial.
-
Nesse exemplo, vamos calcular
o terceiro quartil salarial,
-
para isso, nós vamos lembrar que
os quartis são esses separadores
-
que garantem essas
quatro faixas de 25%.
-
O terceiro quartil garante para nós
que 75% dos dados estão abaixo dele
-
e 25% dos dados
estão acima dele.
-
Nesse caso, então, a gente
começa, na primeira etapa,
-
calculando 75% do total de elementos
que nós temos na base de dados,
-
que no caso é o 135,
então é 75% de 135.
-
Eu vou deixar o resultado
aqui à direita.
-
Fazendo, então, essa continha,
vamos fazer 0,75 vezes 135,
-
o resultado é 101,25.
-
Esse valor, nós vamos aproximar
para o próximo número inteiro,
-
então o próximo inteiro, que vem
logo após o 101,25, é o 102,
-
esse 102 indica para nós
que é o 102° elemento.
-
Agora, nós vamos, nessa
coluna de ordenação aqui,
-
observar onde se encontra
o 102° elemento.
-
Veja que o 102° está dentro dessa
faixa que vai do 100° ao 113º.
-
Então, essa aqui é a classe
da vez, podemos dizer assim,
-
é essa classe que vou
usar como apoio, aqui,
-
para calcular o terceiro
quartil salarial.
-
Vou indicar, aqui, que a classe
definida como apoio, então,
-
é a classe "[6600, 7800[".
-
Como você
pode notar aqui,
-
essa classe não foi escolhida
aleatoriamente na tabela,
-
na verdade, a gente
aplicou a porcentagem
-
sobre o total de elementos
que nós temos,
-
aí sim, nós chegamos
em um determinado valor
-
que foi arredondado para
o próximo número inteiro,
-
porque é um número ordinal, é
o número de ordem de localização,
-
e, aí sim, com essa localização,
usando a coluna de ordenação,
-
é que a faixa "[6600, 7800["
foi definida.
-
Agora, nós vamos calcular,
aqui, o terceiro quartil salarial.
-
Vamos deixar assim?
-
"Q3 =" e, para isso, nós vamos
aplicar aquela formulinha
-
que projeta qualquer
tipo de separador
-
que interessar para você,
-
basta que você possa interpretar
adequadamente o algoritmo
-
seguindo a legenda.
-
Então, nessa célula aqui,
fazendo o cálculo,
-
o terceiro quartil
será o limite inferior
-
da classe que nós
definimos aqui.
-
Então, o limite
inferior é o "6600".
-
Eu vou somar isso aqui,
o limite inferior, com Cs vezes N,
-
já vou deixar aqui entre
parênteses, o Cs é o 0,75.
-
Cs é a porcentagem que fica
abaixo do terceiro quartil, 75%.
-
Esse 75%, esse 0,75, eu vou
multiplicar por esse "N" maiúsculo,
-
que é o total
de elementos, 135,
-
eu vou descontar
a frequência acumulada
-
anterior a essa
classe aqui.
-
Então, atenção porque você vai
na coluna de frequências acumuladas
-
e, nessa coluna
de frequências acumuladas,
-
a frequência acumulada
imediatamente anterior é o "99",
-
então, aqui,
você subtrai 99.
-
Em seguida, você multiplica isso
aqui por "h", o h é a amplitude,
-
é o limite superior menos
o limite inferior da classe.
-
7.800 - 6.600 é 1.200,
-
e você ainda vai dividir isso
aqui por esse "f" minúsculo,
-
que é a frequência
absoluta da classe.
-
"[6600, 7800[",
-
a frequência absoluta é 14, então
eu vou dividir isso aqui por 14.
-
Agora, dando um enter, a gente
pode observar o resultado,
-
que é "6.792,857143".
-
Vamos deixar esse
valor já em reais,
-
vou formatar essa
célula em número,
-
eu vou pedir para deixar
como moeda corrente,
-
valores em reais.
-
Aqui, como a versão
está em inglês,
-
não aparece imediatamente
o valor em reais,
-
a gente dá
uma procuradinha aqui
-
e a gente, então, pode
notar que o valor em reais
-
vai ficar assim:
R$ 6.792,86.
-
O que nós queremos
dizer com isso
-
é que 75% dos salários
dessa tabela,
-
75% das pessoas recebem
menos do que esse valor aqui,
-
e 25% das pessoas recebem
mais que esse valor.
-
Essa resolução
que nós aplicamos
-
para calcular o primeiro
quartil e o terceiro quartil,
-
é aplicada, também, para a gente
calcular um determinado quintil,
-
um determinado
decil ou percentil,
-
basta que a gente faça o ajuste
das respectivas porcentagens
-
que estão associadas
aos separadores
-
que nós vamos calcular.
-
Tivemos, aqui, a oportunidade
de conhecer, então,
-
as chamadas separatrizes.
-
Como nós vimos, são separadores
percentuais de uma base de dados.
-
Esses separadores nos permitem
fazer uma análise mais apurada,
-
mais aprofundada
da base de dados,
-
de acordo com o tipo
de separação que nos interessa.
-
Como nós vimos, podemos
trabalhar com os quartis,
-
com os quintis, com os decis
ou, ainda, com os percentis.