-
Quando nós
-
organizamos uma base de dados
estatísticos,
-
nós temos o objetivo
de obter o máximo de informações
-
a partir da aplicação de uma série de
ferramentas estatísticas que nos permitirá
-
extrair as melhores conclusões
desses dados que foram levantados.
-
Por exemplo, entre as ferramentas
estatísticas que nós utilizamos
-
estão a média aritmética à moda, a mediana
-
e um outro tipo de ferramenta estatística
-
que nós chamamos de C para atrizes.
-
Vamos verificar
então, como é que a gente calcula essas C
-
para atrizes para uma determinada
base de dados, a C para atrizes
-
nada mais são do que separadores
percentuais.
-
Então, nós já conhecemos, na verdade,
-
um tipo de C para atriz,
que é a chamada mediana.
-
A mediana é um separador
que garante 50% dos dados
-
abaixo desse valor e 50% dos dados acima.
-
Ou seja, a mediana é um tipo de separa
atriz e um tipo de separador percentual.
-
Entretanto, nós temos
-
formas de separar a base de dados
em outras porcentagens.
-
Por exemplo,
nós podemos dividir a nossa base de dados
-
em quatro faixas de 25% cada uma.
-
Então, essas faixas que estão associadas
-
à porcentagem 25%, ou seja,
um quarto, são associadas
-
a um tipo de separador que nós chamamos
de quartil ou quartis no plural.
-
Por exemplo,
-
nós também podemos separar
uma base de dados
-
em cinco faixas de 20%.
-
Cada uma dessas faixas,
esse tipo de separação,
-
esse tipo de separador
nós chamamos de de quintil
-
ou em no plural, nós chamamos de tintins.
-
Além dos quartis e dos cantis,
-
nós temos também os desses.
-
Os decis dividem a base de dados
-
em dez faixas de 10% cada uma.
-
Então nós temos essas dez faixas de 10%
-
cada uma,
que são promovidas por nove desses.
-
E ainda nós temos os percentis,
-
que são 99 separadores
-
que vão garantir para nós
100 faixas de 1% cada uma.
-
Esses separadores, então,
-
essas C para atrizes
são chamadas de percentis,
-
para que a gente possa entender um pouco
melhor.
-
Vamos ver então uma representação gráfica
-
desses separadores ou dessas
separa atrizes.
-
O primeiro separador, então, é a mediana,
-
que vai garantir para nós
50% dos dados abaixo
-
e 50% dos dados acima da tal mediana
do valor mediano da base de dados.
-
Então, a mediana é um tipo de separador
que garante 50% dos dados abaixo
-
e 50% dos dados acima do valor mediano.
-
Além da mediana, nós temos os quartis
-
e no caso são três quartis.
-
Esses três separadores aqui vão garantir
para nós quatro faixas de 25% cada uma.
-
E a gente pode então dizer o seguinte
que o primeiro quartil,
-
ele garante para nós
que 25% dos dados estão abaixo
-
e 75% dos dados estão acima.
-
O segundo quartil garante para nós, então,
-
que 50% dos dados estão abaixo
50% dos dados acima.
-
E por último, aqui.
-
O terceiro quartil
que vai garantir para nós
-
que 75% dos dados estão abaixo
-
e 25% dos dados estão acima.
-
Por exemplo, se numa determinada
base de notas de alunos
-
eu informo que o terceiro quartil
das notas foi, por exemplo, seis pontos.
-
O que eu quero dizer para os alunos
-
é que 75% das notas
ficaram abaixo dos seis pontos
-
e 25% das notas
ficaram acima de seis pontos.
-
Isso porque eu disse
-
que o terceiro quartil das notas
foi seis pontos.
-
Perfeito.
-
Se eu digo, por exemplo, que o primeiro
quartil das notas foi quatro pontos,
-
eu quero dizer com isso
que 25% das notas estão abaixo
-
dos quatro pontos e 75% das notas
-
ficaram acima dos quatro pontos.
-
Isso porque eu disse aqui
que o primeiro quartil é quatro pontos.
-
É dessa forma, então, que nós vamos
aplicando e interpretando esses tipos
-
de separadores ou chamados em estatística,
de separar atrizes.
-
Além da mediana e dos quartis,
-
nós temos também os clientes.
-
Veja que os cantis
-
são quatro separadores
que garantem para nós
-
cinco faixas de 20% cada uma,
de maneira que o primeiro quintil,
-
ele garante para nós que 20% dos dados
estão abaixo do primeiro quintil
-
e 80% dos dados são maiores,
estão acima do primeiro quintil.
-
E dessa forma,
a gente segue com esse raciocínio,
-
considerando essas faixas de 20%.
-
O segundo quintil, ele vai garantir 40%
dos dados abaixo e 60% dos dados acima.
-
O terceiro quintil garante 60% abaixo,
-
40% acima, e o quarto quintil
-
vai garantir que 80% dos dados
estão abaixo e 20% dos dados estão acima.
-
Nós temos ainda alguns desses.
-
São nove separadores que garantem para nós
-
dez faixas de 10%, totalizando 100%.
-
E aí a gente diz, por exemplo,
que o primeiro decil vai garantir para nós
-
que 10% dos dados estão abaixo desse valor
-
e 90% dos dados estão acima desse valor.
-
Quando você se refere ao segundo decil
-
de uma base de dados,
o que você quer dizer com isso
-
é que 20% dos dados estão abaixo
daquele valor
-
e 80% dos dados estão acima desse valor.
-
E dessa forma a gente pode seguir com esse
raciocínio até o decil numero nove,
-
o nono decil da base de dados,
que vai garantir
-
que 90% dos dados estão abaixo
e 10% dos dados estão acima.
-
É importante a gente notar
que realmente nós temos algumas
-
coincidências, como por exemplo,
a mediana da base de dados.
-
Ela coincide com o segundo quartil,
que coincide aqui com o quinto decil.
-
Se você reparar o quinto decil,
ele vai deixar
-
50% dos dados abaixo, 50% dos dados acima,
-
que equivale à mediana
e que equivale ao segundo quartil.
-
Por exemplo.
-
Essas equivalências acontecem com outras
-
em outras situações,
como por exemplo, o sexto decil
-
coincide com o terceiro quintil,
por exemplo, entre outras situações.
-
Além dos decis.
-
Nós ainda temos os percentis.
-
São 99 separadores
que vão garantir para nós
-
100 faixas de 1%
cada uma, totalizando 100%.
-
E então,
quando você diz numa certa pesquisa
-
que o segundo percentil é um determinado
valor, você
-
quer dizer que 2% dos dados estão abaixo
-
e 98% dos dados estão acima.
-
Quando você diz que numa pesquisa
o nonagésimo percentil é um determinado
-
valor, você está dizendo que 99% dos dados
estão abaixo daquele valor
-
e apenas 1% dos dados
estão acima daquele valor.
-
Vamos ver então como é que a gente calcula
esses separadores.
-
Essa separa atrizes para projetar,
então uma determinada separa atriz.
-
Inicialmente,
nós vamos organizar uma tabela auxiliar
-
com frequências absolutas,
frequências acumuladas
-
e uma coluna de
ordenação na fila de dados.
-
Em seguida, a gente considera N
-
como sendo o total de elementos
da nossa base de dados.
-
E aí nós vamos utilizar um percentual
-
que está abaixo da Separa Atriz
-
para multiplicar pelo total de elementos
esse percentual que fica abaixo da separa
-
Atriz a gente chama de confins cientistas
separa três CS.
-
E com esse cálculo aqui
nós conseguimos definir justamente
-
qual é a classe
-
que nós vamos usar como apoio, como
referência para aplicar essa forma aqui.
-
Esse modelo matemático, que é uma regrinha
de três que já está aqui
-
organizada para nós,
para facilitar a projeção
-
da C para a atriz que nós pretendemos
calcular,
-
a letra F aqui na Fórmula
é uma sigla genérica de separa atriz.
-
Quando nós vamos fazer os cálculos,
-
nós podemos especificar que separa atriz
e essa se é quartil.
-
O quintil decil percentil, por exemplo,
-
e os demais valores aqui, então,
com as suas respectivas siglas
-
em significados, são utilizados
então como apoio para projetar,
-
para calcular o separador
que nos interessa.
-
Vamos ver então um exemplo de fato aqui,
onde a gente aplica essas fórmulas
-
ou essas observações
que nós acabamos de ver aqui
-
nesse exemplo aqui, nós temos
então uma tabela com uma variedade
-
de salários mensais brutos
organizados em faixas salariais.
-
Aqui nós temos as respectivas quantidades
-
de pessoas associadas às faixas salariais.
-
Aqui,
-
então, temos uma amostra de 135 pessoas.
-
E, por exemplo, aqui temos 23 pessoas
que recebem salários variados.
-
Entretanto,
cada uma dessas pessoas recebe um salário
-
na faixa de 4200 a 5 1.400 R$.
-
Veja que cada uma delas recebe
um salário que fica dentro dessa faixa.
-
Essa é a interpretação perfeita.
-
Isso vale para cada um dos valores
que nós estamos vendo aqui na tabela.
-
Aproveitando essa tabela
que foi apresentada aqui, vamos calcular
-
então o primeiro quartil salarial
dessa base de dados dessa tabela.
-
Para isso nós vamos utilizar o Excel
-
como apoio e verificar
como fica esse cálculo passo a passo.
-
Considerando
então a tabela que foi dada aqui para nós.
-
Eu já deixei aqui uma imagem com a fórmula
que será aplicada
-
que foi apresentada ali no PowerPoint
e aqui
-
eu já comecei a fazer essa tabela auxiliar
Na primeira etapa.
-
Aqui eu já fui digitando,
então as classes que foram dadas.
-
Agora eu vou informar aqui
as frequências absolutas
-
que são essas quantidades de funcionários.
-
Aqui nós podemos observar que são
26, 32, 23,
-
18, 14, 11, 07h04.
-
Aqui vou fazer a soma
de todos esses valores aqui
-
e o somatório desses valores é 135.
-
Como a gente pode observar ali na tabela.
-
Então
-
veja que praticamente aqui eu acabei
copiando a tabela.
-
Agora eu vou organizar aqui
as frequências acumuladas.
-
A primeira frequência acumulada coincide
com a primeira frequência absoluta,
-
então aqui é 26.
-
A segunda frequência acumulada
vai ser a soma das duas primeiras
-
e 26 mais 32 58.
-
Agora, a terceira frequência acumulada
é a soma das 3/1 frequências absolutas
-
aqui no Excel.
-
Eu posso até clicar nas células acima
-
que você vai somar para mim
esses três valores.
-
Em vez de ficar digitando aqui,
posso usar esse recurso.
-
A soma é 81.
-
Então agora eu vou continuar
com essa linha de raciocínio
-
para achar a quarta frequência acumulada.
-
Eu vou somar a primeira absoluta,
mas a segunda absoluta,
-
mais a terceira absoluta,
mais a quarta frequência absoluta
-
chegando aqui 99 Para calcular
a quinta frequência acumulada,
-
nós vamos fazer então a soma dessas
frequências absolutas aqui.
-
Então podemos fazer aqui o 26 somado
-
com 32, somado
com o 23 somado com 18, somado com 14
-
o resultado aqui 113.
-
Vamos seguir com esse raciocínio aqui,
calculando a sexta frequência acumulada.
-
Nesse caso eu vou fazer 26 mais 32
-
mais 23 mais 18 mais 14 mais 11.
-
Vamos obter aqui a sétima frequência
acumulada, Então aqui eu
-
vou fazer o 26 somado com 32 mais 23 mais
-
18, mais 14, mais 11, mais sete
-
E agora por último, eu vou obter aqui a
-
oitava frequência acumulada,
somando o 26 com 32,
-
com 23 com o 18 com 14 com 11
-
com sete com quatro, totalizando aqui 135.
-
Realmente a nossa expectativa
-
é que a última frequência acumulada
aqui conhecida
-
como somatório das frequências absolutas,
-
Realmente essa igualdade deve sempre
ocorrer.
-
Vamos obter então aqui, agora,
-
essa coluna auxiliar de ordenação
na fila de dados.
-
O que nós queremos dizer
aqui é que essas 26 pessoas que ganham
-
entre 1800 e 3 1.000 R$ mensais brutos,
-
elas estão numa fila de 135 pessoas.
-
E nessa fila,
como elas são as 26/1 pessoas da linha,
-
elas vão da primeira
posição até a 26.ª posição.
-
Agora, como parou
-
na 26.ª posição,
a que começa na 27.ª posição
-
e vai até aqui com a oitava posição,
-
que é a frequência acumulada
que nós encontramos aqui.
-
O que nós queremos dizer
com essa faixa de ordenação é que essas 30
-
e duas pessoas que ganham de 3000
a 4 1.200 R$, elas estão numa fila.
-
Essas 30 e duas pessoas
estão numa fila de 135 pessoas.
-
Qual é o local?
-
Qual é a posição dessas 30 e duas pessoas
na fila de 135 pessoas?
-
Veja essas 30 e duas pessoas.
-
Elas ficam posicionadas aqui da 27.ª
-
posição até aqui, em quase mesmo
oitava posição.
-
Como que eu descobri
que essas 30 e duas pessoas
-
estão nessa posição aqui na fila de 135
pessoas?
-
Foi fácil.
-
Veja como aqui nós temos 26 elementos,
Então a gente
-
tendo que vai da primeira à 26.ª
posição para começar.
-
Então, como parou na 26.ª posição,
começa na 27.ª.
-
Foi assim que eu cheguei, com 27 aqui.
-
E eu sei que termina
na frequência acumulada. 58
-
Vamos
então prosseguir com esse raciocínio.
-
Para completar essa coluna de ordenação.
-
Para projetar o primeiro quartil,
-
uma vez que nós
já temos essa tabela organizada
-
inicialmente, nós vamos lembrar,
então que os quartis são esses separadores
-
que vão garantir para nós
quatro faixas de 25%.
-
Então, o primeiro quartil, ele garante 25%
-
dos dados abaixo e 75% dos dados acima.
-
Portanto, nós vamos começar
inicialmente aqui calculando 25%
-
do total de elementos que nós
temos aqui na base de dados, que é o 135.
-
Então, ao fazer essa conta aqui,
-
ao fazer 25% vezes ou 135,
-
nós vamos chegar aqui 33,75.
-
Agora, esse valor aqui nós vamos aproximar
-
para o próximo número inteiro,
-
o próximo número inteiro que vem
-
logo após o 33 é 75 e o 34.
-
Esse 34 aqui
é o 34.º elemento da fila de dados.
-
E aí nós vamos
-
verificar aqui agora,
com o apoio dessa coluna de ordenação,
-
qual é a faixa
que está associada a essa posição.
-
Veja aqui.
-
O 34.º elemento da fila está nessa posição
aqui,
-
entre a 27.ª posição e aqui com a Jéssica
estava a posição.
-
Portanto,
a classe associada a essa posição
-
aqui é a classe 3000 4200.
-
Então vou copiar aqui essa classe
3000 4200.
-
E nós dizemos
então que essa aqui é a classe
-
que será utilizada como apoio
para a aplicação da fórmula.
-
Vou trazer aqui essa imagem da fórmula,
então, para que a gente possa agora
-
assim calcular o primeiro quartil
da base de dados, o primeiro quartil.
-
Ele é representado por essa sigla
que um é o quartil número um.
-
Se você quiser deixar um subscrito,
você pode vir aqui em Fonte
-
e ele fica aqui subscrito.
-
Ele fica nessa forma aqui de índice.
-
Agora nessa célula eu vou fazer
então o cálculo da
-
DA separa três,
que é o quartil que nos interessa.
-
Para calcular Então a separar três,
nós vamos ter que fazer
-
o limite inferior da classe, que é O31000
-
somado com aplicando aqui a fórmula
CS vezes.
-
Veja só o CS e o coeficiente da
separa três é a porcentagem
-
que fica abaixo do primeiro quartil,
ou seja, é 25%
-
na forma decimal 0,25.
-
Eu vou multiplicar isso aqui
pelo N maiúsculo
-
aqui na forma que é o total de Elementos
que é o 135,
-
vou descontar a frequência acumulada
anterior a essa classe.
-
Veja aqui a classe 3200 4200
-
tem frequência acumulada anterior 26
-
e, em seguida,
eu vou multiplicar isso aqui
-
pela amplitude da classe que é o H,
A amplitude é 4200
-
-3000 1200 de amplitude.
-
E ainda vou dividir isso aqui
pela frequência absoluta dessa classe.
-
A classe 3000 4200
-
tem frequência absoluta 32,
então vou dividir aqui por 32.
-
E esse f minúsculo aqui é a frequência
absoluta da classe em questão.
-
Agora eu vou dar uma inteira aqui para
a gente ver o resultado dessa continha.
-
Então veja que esse valor aqui
é um salário
-
que representa
o primeiro quartil salarial.
-
Se você quiser ainda, você pode clicar
com o lado direito do mouse
-
e aqui pedir para formatar célula
e aqui na opção número
-
você pode deixar como moeda corrente
valores em reais.
-
Aqui mais abaixo é possível
a gente selecionar
-
o tipo de moeda que nos interessa aqui.
-
Vamos localizar
-
então aqui os valores em reais
e dessa forma.
-
Então o primeiro quartil salarial
é o salário de 3.290,63 R$.
-
Isso significa dizer que 25% das pessoas
recebem menos do que esse valor
-
é 75% das pessoas
recebem acima desse valor.
-
É dessa forma que a gente projeta, então,
o primeiro quartil salarial.
-
Vamos ver então um outro exemplo,
-
onde a gente calcula
o terceiro quartil salarial.
-
Nesse exemplo.
-
Então vamos calcular
o terceiro quartil salarial para isso.
-
Nós vamos lembrar então,
-
que os quartis são esses separadores
que garantem essas quatro faixas de 25%.
-
O terceiro quartil.
-
Ele garante para nós que 75% dos dados
-
estão abaixo dele
e 25% dos dados estão acima dele.
-
Nesse caso.
-
Então, a gente começa na primeira etapa
aqui, calculando
-
75% do total de elementos
que nós temos na base de dados aqui,
-
que no caso é o 135, então é 75% de 135.
-
Eu vou deixar o resultado aqui à direita
fazendo então essa continha.
-
Vamos fazer zero 75 vezes 135.
-
O resultado é 101,25.
-
É esse valor.
-
Aqui nós vamos aproximar
para o próximo número inteiro.
-
Então o próximo inteiro que vem
logo após o 101,25 é o 102.
-
Esse 102 ele indica para nós
que é o centésimo segundo elemento.
-
Agora nós vamos nessa coluna de ordenação
aqui observar
-
onde se encontra o centésimo
segundo elemento.
-
Veja que o centésimo segundo
está dentro dessa faixa aqui,
-
que vai 200.ª o centésimo 13.º.
-
Então, essa aqui é a classe da vez,
podemos dizer assim É essa classe
-
que vou usar como apoio aqui
para calcular o terceiro quartil salarial.
-
Vou indicar então aqui
que a classe definida como apoio
-
então é a classe seis é 607 e 800.
-
Como você pode notar aqui,
essa classe não foi escolhida
-
aleatoriamente na tabela.
-
Na verdade, a gente aplicou a porcentagem
sobre o total de elementos que nós temos.
-
Aí sim nós chegamos num determinado valor
que foi arredondado
-
para o próximo número inteiro,
porque é um número ordinal,
-
é o número de ordem de localização
e aí sim, com essa localização
-
usando a coluna de ordenação é que a faixa
-
seis em 607 800 foi definida.
-
Agora nós vamos calcular aqui
o terceiro quartil salarial.
-
Vamos deixar assim
-
que três igual é para isso.
-
Nós vamos então aplicar aquela formulinha
-
que projeta qualquer tipo de separador
que interessar para você.
-
Basta que você possa interpretá
la adequadamente.
-
Aqui o algoritmo seguindo a legenda.
-
Então, nessa célula aqui,
fazendo o cálculo, o terceiro quartil
-
será o limite inferior da classe
que nós definimos aqui.
-
Então o limite inferior é O61600.
-
Eu vou somar isso aqui
o limite inferior com c s vezes n.
-
Já vou deixar aqui entre parênteses
o CS e os zero 75 CS
-
é a porcentagem que fica abaixo
do terceiro quartil, 75%.
-
Esse 75% esses eram 75.
-
Eu vou multiplicar por esse em maiúsculo
-
que é o total de elementos 135.
-
Eu vou desse contar a frequência acumulada
anterior a essa classe aqui.
-
Então atenção porque você vai na coluna
de frequências acumuladas acumuladas
-
e nessa coluna de frequências acumuladas
a frequência acumulada imediatamente
-
anterior é 99, então aqui você subtrai
-
99, Em seguida, você multi
aplica isso aqui por H.
-
O h é a amplitude é o limite superior
menos o limite inferior da classe
-
7800 -6000 e 600.200.
-
E você ainda vai dividir isso aqui
por esse f minúsculo
-
que é a frequência absoluta da classe
-
seis e 607 800 a frequência absoluta 14.
-
Então vou dividir isso aqui por 14
agora dando um enter,
-
a gente pode observar o resultado,
que é 6.792,8571.
-
Vamos achar esse valor então,
já que em reais vou formatar essa célula
-
aqui em número, eu vou pedir para deixar
como moeda corrente de valores em reais.
-
Aqui como a versão está inglesa, não
aparece imediatamente o valor em reais.
-
A gente está a procurar aqui e a gente
então pode notar que o valor em reais
-
vai ficar assim 6.792 R$ e 86 60.
-
O que nós queremos dizer com isso
-
é que 75% dos salários aqui dessa tabela,
-
75% das pessoas
recebem menos do que esse valor.
-
Aqui é 25% das pessoas
recebem acima desse valor.
-
Essa resolução que nós aplicamos
para calcular
-
o primeiro quartil e o terceiro quartil,
ela é aplicada também para a gente
-
calcular um determinado quintil,
um determinado decil ou percentil.
-
Basta que a gente faça o ajuste
das respectivas porcentagens
-
que estão associadas
aos separadores que nós vamos calcular.
-
Tivemos
então aqui a oportunidade de conhecer
-
então as chamadas para atrizes.
-
Como nós vimos, são separadores
percentual, mais de uma base de dados.
-
Esses separadores nos permitem
fazer uma análise
-
mais apurada,
mais aprofundada da base de dados,
-
de acordo com o tipo de separação
que nos interessa.
-
Como nós podemos.
-
Podemos trabalhar com os quartis,
com os cantis,
-
com os desses ou ainda com os percentis.