< Return to Video

ES CAP02 2025 VA01 DISTRIBUICOES DE FREQUENCIAS SEM CLASSES COM CLASSES

  • 0:08 - 0:11
    Quando nós trabalhamos
    com dados estatísticos,
  • 0:11 - 0:14
    em muitas situações, nós temos
    um grande número de dados,
  • 0:14 - 0:19
    um grande número de informações
    que foram obtidas na pesquisa,
  • 0:19 - 0:21
    são os dados que foram
    levantados na pesquisa,
  • 0:21 - 0:24
    a gente usa esse termo,
    é o levantamento de dados,
  • 0:24 - 0:29
    as informações que foram
    coletadas em uma certa pesquisa.
  • 0:29 - 0:34
    E para facilitar a visualização,
    ou mesmo para resumir,
  • 0:34 - 0:37
    a gente utiliza
    tabelas de dados.
  • 0:37 - 0:41
    Essas tabelas nos ajudam
    a entender de forma mais rápida
  • 0:41 - 0:44
    ou compreender um pouco
    melhor aqueles dados
  • 0:44 - 0:46
    que foram obtidos na pesquisa.
  • 0:46 - 0:49
    Nós temos dois
    tipos de tabelas:
  • 0:49 - 0:54
    as tabelas sem classes
    e as tabelas com classes.
  • 0:54 - 0:59
    Essas tabelas são chamadas
    de distribuições de frequências
  • 0:59 - 1:03
    na linguagem estatística, aqui
    utilizando um termo mais técnico.
  • 1:03 - 1:07
    Vamos ver exemplos desses dois tipos
    de distribuições de frequências
  • 1:07 - 1:11
    e a gente continua esclarecendo
    um pouco melhor esse tema,
  • 1:11 - 1:14
    as chamadas distribuições
    de frequências.
  • 1:14 - 1:16
    Nesse exemplo aqui,
  • 1:16 - 1:20
    nós temos uma distribuição
    de frequência simples.
  • 1:20 - 1:24
    Observe que, aqui na primeira
    coluna, nós temos algumas idades
  • 1:24 - 1:28
    de um determinado grupo
    de pessoas, e essas são as idades,
  • 1:28 - 1:33
    por exemplo, em anos, 21 anos,
    22 anos, até 26 anos.
  • 1:33 - 1:37
    E, nessa segunda coluna,
    nós temos as frequências
  • 1:37 - 1:42
    com as quais essas idades foram
    observadas nesse grupo de pessoas.
  • 1:42 - 1:46
    Por exemplo, nesse grupo de pessoas
    aqui, tem uma pessoa com 21 anos,
  • 1:46 - 1:50
    tem três pessoas que cada
    uma delas tem 22 anos.
  • 1:50 - 1:55
    Por exemplo, aqui, nessa tabela,
    a gente tem cinco pessoas,
  • 1:55 - 1:57
    de forma que cada
    uma dessas cinco pessoas
  • 1:57 - 2:00
    possui 24 anos
    e assim por diante.
  • 2:00 - 2:04
    Três pessoas, cada
    uma delas com 26 anos.
  • 2:04 - 2:05
    Esse tipo de tabela, então,
  • 2:05 - 2:10
    nós chamamos de distribuição
    de frequência simples.
  • 2:10 - 2:13
    Repare que, na primeira coluna,
  • 2:13 - 2:17
    que é a coluna
    da variável de pesquisa,
  • 2:17 - 2:21
    nós não temos faixas
    etárias, por exemplo,
  • 2:21 - 2:24
    nós não temos
    aqueles intervalos
  • 2:24 - 2:27
    que nós observamos
    em alguns tipos de tabelas.
  • 2:27 - 2:30
    Por exemplo, uma faixa
    etária seria algo do tipo
  • 2:30 - 2:35
    idade variando de 21 anos
    até 25 anos.
  • 2:35 - 2:37
    A gente poderia ter
    uma faixa etária aqui,
  • 2:37 - 2:41
    eu poderia ter uma tabela
    com faixas etárias.
  • 2:41 - 2:44
    Justamente, uma tabela
    com faixas etárias
  • 2:44 - 2:45
    é uma tabela
    que a gente chama
  • 2:45 - 2:49
    de distribuição de frequências
    com classes,
  • 2:49 - 2:51
    não é o caso dessa
    tabela aqui.
  • 2:51 - 2:55
    Vamos ver, então, uma tabela
    que apresenta classes,
  • 2:55 - 2:56
    é o próximo exemplo.
  • 2:56 - 3:01
    Aqui sim, veja que, nessa tabela,
    nós temos três faixas etárias,
  • 3:01 - 3:07
    nós temos 4 pessoas com idades
    entre 21 anos e 23 anos,
  • 3:07 - 3:10
    23 anos ainda
    não completos,
  • 3:10 - 3:15
    7 pessoas com idades variadas
    no intervalo de 23 anos, inclusive,
  • 3:15 - 3:20
    até 25 anos, e 5 pessoas
    com idades variadas
  • 3:20 - 3:24
    no intervalo de 25 anos
    a 27 anos.
  • 3:24 - 3:26
    Essa notação matemática
    da estatística
  • 3:26 - 3:30
    significa que o valor que está
    à esquerda, no caso é o 21,
  • 3:30 - 3:35
    falando da primeira classe aqui,
    o 21 está incluído na faixa de dados,
  • 3:35 - 3:37
    já o segundo valor
    aqui, que é o 23,
  • 3:37 - 3:40
    como nós não temos
    esse traço vertical,
  • 3:40 - 3:43
    nós entendemos que o 23
    não está incluído.
  • 3:43 - 3:47
    Então, aqui nós temos 4 pessoas
    com idades a partir de 21 anos,
  • 3:47 - 3:52
    mas essas pessoas ainda não
    chegaram a completar os 23 anos.
  • 3:52 - 3:55
    As pessoas que já têm
    os 23 anos completos
  • 3:55 - 4:00
    foram contadas nesse outro subgrupo
    aqui, nessa outra faixa etária
  • 4:00 - 4:05
    que vai dos 23, aí sim, 23 anos
    já completos, até os 25 anos,
  • 4:05 - 4:11
    mas veja que, no 25, nós não temos
    a presença desse traço vertical,
  • 4:11 - 4:15
    indicando que o 25 não faz
    parte dessa faixa etária.
  • 4:15 - 4:20
    Seria de 23 até 24 anos,
    11 meses e 29 dias,
  • 4:20 - 4:24
    essas 7 pessoas ainda não
    chegaram a completar 25 anos.
  • 4:24 - 4:28
    Então, esse tipo de notação
    estatística é muito usual.
  • 4:28 - 4:33
    Em vez de usar essa notação com
    o traço vertical e o traço horizontal,
  • 4:33 - 4:37
    nós também podemos usar
    essa outra notação: o colchete.
  • 4:37 - 4:40
    Nós dizemos que o colchete,
    aqui, está fechado em 21
  • 4:40 - 4:44
    e o 23 nós podemos
    deixar parênteses
  • 4:44 - 4:47
    ou também podemos
    usar um colchete aberto.
  • 4:47 - 4:48
    Para exemplificar
    um pouco melhor
  • 4:48 - 4:52
    esses dois tipos de distribuições
    de frequências,
  • 4:52 - 4:56
    nós vamos utilizar o Excel e vamos
    ver, então, exemplos de tabelas.
  • 4:56 - 4:59
    Então, observe que, nessa
    tabela aqui, como exemplo,
  • 4:59 - 5:04
    nós temos o número de filhos por
    funcionário, nessa primeira coluna,
  • 5:04 - 5:06
    e na segunda coluna é
    o número de funcionários
  • 5:06 - 5:07
    de uma determinada empresa.
  • 5:07 - 5:10
    Então, por exemplo,
    aqui, eu vou considerar
  • 5:10 - 5:13
    alguns possíveis valores
    para número de filhos,
  • 5:13 - 5:17
    por exemplo,
    0 filhos, 1, 2, 3, 4, 5,
  • 5:17 - 5:20
    e, aqui, uma certa
    quantidade de funcionários.
  • 5:20 - 5:23
    É só um exemplo, eu vou
    deixar aqui valores aleatórios.
  • 5:23 - 5:27
    Vamos imaginar que a gente tem 40
    funcionários que não possuem filhos,
  • 5:27 - 5:29
    32 funcionários com um filho,
  • 5:29 - 5:33
    aqui, por exemplo, 28
    funcionários com 2 filhos.
  • 5:33 - 5:35
    Aí, aqui, a gente
    tem uma queda
  • 5:35 - 5:39
    para 20 funcionários
    que possuem 3 filhos,
  • 5:39 - 5:44
    12 funcionários com 4 filhos
    e 4 funcionários com 5 filhos.
  • 5:44 - 5:49
    Nós podemos, também, fazer
    a soma para verificar, opa,
  • 5:49 - 5:53
    aqui a soma, podemos
    usar o SUM, no Excel,
  • 5:53 - 5:57
    e aí usando essa função SUM,
    a gente faz o somatório
  • 5:57 - 6:00
    desses valores que estão
    nessa coluna aqui.
  • 6:00 - 6:03
    Esse somatório é "136".
  • 6:03 - 6:07
    Então, nós podemos entender,
    com essa tabela de dados,
  • 6:07 - 6:11
    que nós temos uma pesquisa que foi
    realizada com 136 funcionários
  • 6:11 - 6:13
    de uma determinada empresa.
  • 6:13 - 6:18
    Nós também podemos interpretar
    que esses 136 funcionários
  • 6:18 - 6:20
    representam uma amostra
  • 6:20 - 6:24
    de uma população
    de funcionários dessa empresa.
  • 6:24 - 6:27
    Um exemplo: essa empresa pode
    ter milhares de funcionários
  • 6:27 - 6:31
    e aqui nós temos uma amostra
    de 136 funcionários.
  • 6:31 - 6:34
    Lembrando que amostra
    é um subconjunto
  • 6:34 - 6:36
    de uma população
    de dados estatísticos.
  • 6:36 - 6:38
    Aqui é importante a gente
    compreender também,
  • 6:38 - 6:42
    ao ler a tabela, que nós estamos
    dizendo que há 20 pessoas,
  • 6:42 - 6:46
    por exemplo, de maneira
    que cada uma dessas pessoas,
  • 6:46 - 6:49
    cada um desses funcionários
    possui 3 filhos.
  • 6:49 - 6:53
    Então, aqui no acumulado, nós
    podemos dizer que tem 20 vezes 3,
  • 6:53 - 6:57
    a gente tem 60 filhos aqui,
    digamos, no acumulado,
  • 6:57 - 7:00
    são 20 onde cada
    um possui 3 filhos.
  • 7:00 - 7:03
    É importante a gente
    ter essa interpretação.
  • 7:03 - 7:06
    Nós podemos, ainda, detalhar
    um pouco mais essa tabela
  • 7:06 - 7:10
    organizando ela
    em duas colunas.
  • 7:10 - 7:13
    O número de filhos por funcionário
    representa, para nós,
  • 7:13 - 7:17
    a chamada variável de pesquisa,
    ou seja, é o tema da pesquisa.
  • 7:17 - 7:20
    O objetivo da pesquisa
    é fazer uma análise
  • 7:20 - 7:22
    sobre o número de funcionários,
  • 7:22 - 7:26
    ou, melhor dizendo, sobre
    o número de filhos por funcionário.
  • 7:26 - 7:28
    Nós queremos saber se esse
    número de filhos está aumentando
  • 7:28 - 7:31
    ou se está diminuindo,
    eventualmente.
  • 7:31 - 7:37
    Então, aqui, nós também podemos
    representar dessa forma, "x1= 0".
  • 7:37 - 7:41
    Esse "1" aqui, se você quiser, você
    pode deixar na forma de índice,
  • 7:41 - 7:46
    selecionando apenas o algarismo
    1 aqui, apenas o número 1,
  • 7:46 - 7:49
    em seguida, você
    vem aqui em fonte
  • 7:49 - 7:53
    e aí você pode deixar
    como subscrito.
  • 7:53 - 7:58
    Dessa forma, o 1 fica pequeno,
    fica na parte inferior direita.
  • 7:58 - 8:02
    A gente está dizendo
    aqui que o x1 é igual a 0.
  • 8:02 - 8:03
    Veja que aqui,
    genericamente,
  • 8:03 - 8:08
    a gente representa a variável
    de pesquisa como "xi".
  • 8:08 - 8:14
    Essa letra "i" é associada à palavra
    "índice", então é x índice 1,
  • 8:14 - 8:17
    ou seja, o primeiro valor
    da variável de pesquisa é 0,
  • 8:17 - 8:19
    o x1 é igual a 0.
  • 8:19 - 8:25
    Aqui, nós podemos continuar,
    então, indicando, "x2 = 1",
  • 8:25 - 8:36
    depois "x3 =2", "x4 = 4",
    opa, o "x4 = 3", corrigindo.
  • 8:36 - 8:43
    Em seguida, você tem
    o "x5 = 4" e o "x6 = 5".
  • 8:43 - 8:47
    Então, nós temos seis valores
    para a variável de pesquisa aqui.
  • 8:47 - 8:51
    Vamos deixar, então,
    todos aqui subscritos,
  • 8:51 - 8:57
    podemos então fazer assim,
    subscrito e, dessa forma,
  • 8:57 - 9:01
    nós estamos indicando
    os respectivos índices,
  • 9:01 - 9:04
    o quarto valor da variável
    de pesquisa é o número 3,
  • 9:04 - 9:06
    por exemplo.
  • 9:06 - 9:12
    O quinto valor da variável
    de pesquisa é o valor "4", 4 filhos,
  • 9:12 - 9:15
    e o sexto valor
    da variável de pesquisa
  • 9:15 - 9:19
    é o valor "5",
    ou seja, 5 filhos.
  • 9:19 - 9:22
    Nessa coluna aqui, nós vamos
    detalhar um pouco melhor
  • 9:22 - 9:26
    as chamadas frequências
    absolutas.
  • 9:26 - 9:28
    Nós dizemos que são
    frequências absolutas
  • 9:28 - 9:33
    porque não são porcentagens, aqui,
    por exemplo, não é 40%, não é 20%,
  • 9:33 - 9:38
    é 40 funcionários de um grupo
    de 136 funcionários,
  • 9:38 - 9:40
    é o número absoluto
    de funcionários,
  • 9:40 - 9:44
    não o número percentual, daí
    o termo "frequência absoluta".
  • 9:44 - 9:46
    Então, aqui, para se referir
    às frequências,
  • 9:46 - 9:50
    nós usamos, genericamente,
    a sigla "fi"
  • 9:50 - 9:54
    e nós podemos, então, especificar
    como sendo a frequência número 1.
  • 9:54 - 9:58
    A frequência número 1, aqui,
    é o 40, podemos deixar assim?
  • 9:58 - 10:01
    Subscrito e, dessa
    forma, eu vou indicar
  • 10:01 - 10:04
    cada uma das demais
    frequências aqui da tabela.
  • 10:04 - 10:09
    A frequência número 2 é o valor 32,
    a frequência número 3 é o valor 28,
  • 10:09 - 10:13
    como vocês podem observar
    aqui na segunda coluna,
  • 10:13 - 10:17
    a frequência número 4
    é o valor 20,
  • 10:17 - 10:24
    a frequência 5 é o valor 12
    e a frequência 6 é o valor 4.
  • 10:24 - 10:28
    Aqui, nós vamos deixar esses valores
    indicados na forma de índice
  • 10:28 - 10:33
    e o índice é indicado
    na parte inferior direita.
  • 10:33 - 10:37
    Quando o valor, quando
    o número fica indicado
  • 10:37 - 10:41
    na parte superior direita,
    a gente chama de expoente.
  • 10:41 - 10:43
    Imagine só, f ao cubo,
    por exemplo,
  • 10:43 - 10:48
    f elevado à quarta potência,
    fica o quatro pequeno,
  • 10:48 - 10:51
    reduzido na parte
    superior direita.
  • 10:51 - 10:56
    Quando o valor é indicado na parte
    inferior à direita da letra,
  • 10:56 - 10:59
    a gente chama isso de índice.
  • 10:59 - 11:02
    É um detalhe aqui e faz parte
    dessa comunicação, da linguagem,
  • 11:02 - 11:05
    da representação
    estatística, tudo bem?
  • 11:05 - 11:09
    Então, aqui, a gente diz que
    é f índice 6 é igual a 4.
  • 11:09 - 11:12
    Portanto, aqui nós acabamos
    por detalhar um pouco melhor
  • 11:12 - 11:14
    essa tabela que foi
    apresentada para nós.
  • 11:14 - 11:17
    Geralmente a tabela é apresentada
    assim de maneira mais simples
  • 11:17 - 11:20
    e aqui é uma percepção
    mais aprofundada,
  • 11:20 - 11:23
    inclusive para que a gente
    possa utilizar fórmulas
  • 11:23 - 11:26
    ou que a gente possa implementar
    isso em termos computacionais,
  • 11:26 - 11:29
    usando linguagem
    matricial, por exemplo.
  • 11:29 - 11:30
    Nós vimos um exemplo
  • 11:30 - 11:34
    com distribuições
    de frequências sem classes.
  • 11:34 - 11:36
    Vamos ver agora um exemplo,
    utilizando Excel,
  • 11:36 - 11:40
    de uma distribuição
    de frequências com classes.
  • 11:40 - 11:44
    Nesse exemplo aqui,
    nós temos uma tabela
  • 11:44 - 11:48
    onde, na primeira coluna, nós temos
    possíveis salários mensais brutos,
  • 11:48 - 11:51
    em reais, e o número
    de funcionários.
  • 11:51 - 11:54
    Por exemplo, aqui nós
    podemos criar uma classe
  • 11:54 - 12:00
    onde os salários começam a partir
    de R$ 2.400, por exemplo.
  • 12:00 - 12:05
    E, aqui, o valor, vamos
    imaginar, vai até R$ 3.200.
  • 12:05 - 12:09
    Aqui, nós, usualmente,
    deixamos o colchete aberto.
  • 12:09 - 12:13
    Veja que, tradicionalmente, essa
    aqui é a posição convencional
  • 12:13 - 12:15
    de dois colchetes.
  • 12:15 - 12:19
    Aqui, a gente diz que os dois
    colchetes estão fechados.
  • 12:19 - 12:21
    Dessa forma que eu
    representei aqui,
  • 12:21 - 12:24
    o primeiro colchete
    está fechado,
  • 12:24 - 12:27
    isso é uma maneira
    de incluir o valor,
  • 12:27 - 12:31
    e o segundo colchete
    está aberto.
  • 12:31 - 12:35
    Então, aqui, o segundo colchete,
    vamos deixar de uma outra cor,
  • 12:35 - 12:37
    veja que ele está em vermelho,
    ele está em uma posição diferente
  • 12:37 - 12:40
    da posição convencional
    dos colchetes.
  • 12:40 - 12:44
    Essa notação é uma maneira de dizer
    que nós temos, por exemplo, aqui,
  • 12:44 - 12:48
    30 funcionários que recebem
    salários variados
  • 12:48 - 12:51
    dentro da faixa
    de R$ 2.400 a R$ 3.200,
  • 12:51 - 12:55
    de maneira que essa
    faixa salarial, na verdade,
  • 12:55 - 13:05
    começa exatamente em R$ 2.400
    e ela vai até R$ 3.199,99,
  • 13:05 - 13:08
    mas não chega
    aos R$ 3.200.
  • 13:08 - 13:11
    Quem ganha
    exatamente R$ 3.200
  • 13:11 - 13:15
    será contado na próxima
    faixa de dados,
  • 13:15 - 13:19
    que vai de R$ 3200
    até R$ 4.000.
  • 13:19 - 13:23
    Aqui, por exemplo, vamos imaginar,
    que a gente tem 25 funcionários.
  • 13:23 - 13:28
    Então, veja só, aqui nós temos 25
    funcionários com salários variados
  • 13:28 - 13:34
    começando a partir de R$ 3.200
    até R$ 4.000 exclusive.
  • 13:34 - 13:36
    Então, são termos
    que são utilizados.
  • 13:36 - 13:41
    O colchete fechado é uma forma
    de dizer que o 3.200 está incluído,
  • 13:41 - 13:44
    ou seja, inclusive 3.200,
  • 13:44 - 13:46
    e o colchete aberto é
    uma maneira de dizer
  • 13:46 - 13:49
    que o 4.000 não está
    incluído nesse intervalo,
  • 13:49 - 13:55
    na verdade, vai de 3.200
    até 3.999,99,
  • 13:55 - 13:59
    de maneira, então, que a gente
    diz que 4.000 é exclusive,
  • 13:59 - 14:00
    exclusive 4.000.
  • 14:00 - 14:04
    Temos 25 pessoas que recebem
    salários variados
  • 14:04 - 14:07
    de R$ 3.200 a R$ 4.000,
  • 14:07 - 14:12
    R$ 3.200 inclusive,
    R$ 4.000 exclusive.
  • 14:12 - 14:14
    Observe também que,
    nessa tabela aqui,
  • 14:14 - 14:18
    nós temos essa variação
    dentro dessa faixa salarial aqui.
  • 14:18 - 14:24
    Veja que a diferença, R$ 4.000
    menos R$ 3.200, é de R$ 800.
  • 14:24 - 14:28
    Esses R$ 800, essa diferença
    R$ 4.000 menos R$ 3.200,
  • 14:28 - 14:32
    é o que nós chamamos
    de amplitude, por exemplo.
  • 14:32 - 14:35
    Então, veja que, aqui,
    nós podemos considerar
  • 14:35 - 14:39
    que nós temos um exemplo
    onde, se você faz a diferença
  • 14:39 - 14:45
    entre 3200 e 2400, você
    vai chegar no valor 800
  • 14:45 - 14:50
    e nós dizemos que esse 800
    é o valor da amplitude.
  • 14:50 - 15:00
    Nesse caso, todas as faixas
    irão possuir amplitude 800.
  • 15:00 - 15:02
    Vamos construir aqui
    mais algumas faixas, então,
  • 15:02 - 15:07
    considerando esse padrão aqui,
    onde o próximo valor é o 4.000,
  • 15:07 - 15:11
    aí nós vamos somar
    800, vai para 4.800.
  • 15:11 - 15:16
    Dessa forma, a gente vai construindo
    aqui inúmeras faixas salariais.
  • 15:16 - 15:19
    Aqui vai de 4.800 a 5.600.
  • 15:19 - 15:26
    Aqui já começa a partir de 5.600
    e vai até, somando 800, 6.400,
  • 15:26 - 15:28
    exclusive o 6.400.
  • 15:28 - 15:33
    Aqui começa a partir
    de 6.400 e vai até 7.200,
  • 15:33 - 15:38
    aqui nós começamos em 7.200
    e isso aqui vai até 8.000,
  • 15:38 - 15:43
    e a última faixa salarial,
    a última classe de salários
  • 15:43 - 15:48
    começa em 8.000
    e termina em 8.800.
  • 15:48 - 15:51
    Aqui, nós estamos deixando
    alguns valores como exemplo,
  • 15:51 - 15:54
    alguns valores aleatórios
    em cada uma dessas faixas.
  • 15:54 - 15:58
    Imagine, então, que aqui seja,
    por exemplo, 22, aqui, 20,
  • 15:58 - 16:03
    17, 12, 8 e 5,
    por exemplo.
  • 16:03 - 16:05
    Vamos deixar "6" aqui?
  • 16:05 - 16:08
    Assim, a gente tem,
    então, 140 funcionários
  • 16:08 - 16:11
    que participaram
    de uma certa pesquisa,
  • 16:11 - 16:16
    e essa pesquisa foi tabulada
    e foi representada
  • 16:16 - 16:18
    por meio dessa
    tabela de dados.
  • 16:18 - 16:19
    Essa tabela de dados
  • 16:19 - 16:23
    é o que nós chamamos
    de distribuição de frequências.
  • 16:23 - 16:28
    Quando nós usamos nas tabelas
    o recurso de faixas salariais,
  • 16:28 - 16:33
    por exemplo, ou faixas
    etárias, por exemplo,
  • 16:33 - 16:37
    nós estamos trabalhando
    com classes de dados estatísticos.
  • 16:37 - 16:44
    Veja que nessa tabela nós temos
    1, 2, 3, 4, 5, 6, 7, 8 faixas salariais,
  • 16:44 - 16:48
    isto é, 8 classes de dados.
  • 16:48 - 16:52
    Cada uma das classes
    possui o limite inferior,
  • 16:52 - 16:55
    que é genericamente representado
    pela letra "l", minúscula,
  • 16:55 - 16:58
    e o limite superior,
  • 16:58 - 17:04
    que é tradicionalmente indicado
    com a letra "L", maiúscula.
  • 17:04 - 17:10
    E a diferença entre o limite
    superior e o limite inferior,
  • 17:10 - 17:15
    de cada classe, fornece
    para nós um elemento
  • 17:15 - 17:19
    que nós chamamos
    de amplitude de classe,
  • 17:19 - 17:22
    que é representado pela
    letra "H", tradicionalmente.
  • 17:22 - 17:27
    Então, a amplitude da classe é
    a diferença entre o limite superior
  • 17:27 - 17:32
    e o limite inferior
    de uma determinada classe.
  • 17:32 - 17:35
    É muito usual nós
    trabalhamos com tabelas
  • 17:35 - 17:42
    nas quais todas as classes
    apresentam a mesma amplitude.
  • 17:42 - 17:43
    Se você observar aqui,
  • 17:43 - 17:47
    todas as classes apresentam
    amplitude 800.
  • 17:47 - 17:50
    Entretanto, é possível nós
    trabalhamos com tabelas
  • 17:50 - 17:53
    nas quais as amplitudes
    sejam diferentes,
  • 17:53 - 17:56
    e a gente pode justificar
    isso de alguma forma.
  • 17:56 - 17:59
    Nesse último exemplo
    que nós desenvolvemos,
  • 17:59 - 18:03
    observe que todas as classes
    apresentam a mesma amplitude
  • 18:03 - 18:06
    que é a amplitude 800.
  • 18:06 - 18:09
    Um desafio na organização
    de distribuição
  • 18:09 - 18:11
    de frequências com classes
  • 18:11 - 18:16
    é justamente decidir qual
    será a amplitude da classe.
  • 18:16 - 18:18
    Como é que a gente faz
    para saber, digamos,
  • 18:18 - 18:20
    qual é a amplitude
    que nós vamos adotar?
  • 18:20 - 18:25
    Se vai ser amplitude 800, como
    nós vimos no exemplo anterior,
  • 18:25 - 18:27
    ou se vai ser
    uma outra amplitude.
  • 18:27 - 18:29
    Na verdade, nós não
    temos nenhuma regra fixa,
  • 18:29 - 18:32
    mas há algumas sugestões
    que são utilizadas,
  • 18:32 - 18:34
    são tradicionalmente
    utilizadas em estatística,
  • 18:34 - 18:38
    para definir a amplitude
    que será adotada
  • 18:38 - 18:42
    nas classes que você vai organizar,
    em uma tabela que você vai preparar
  • 18:42 - 18:45
    a partir de dados estatísticos
    que foram coletados
  • 18:45 - 18:47
    em uma certa pesquisa.
  • 18:47 - 18:50
    Vamos observar, então,
    quais são essas sugestões,
  • 18:50 - 18:51
    esses modelos estatísticos.
  • 18:51 - 18:55
    Então, para determinar o número
    de classes que você vai utilizar
  • 18:55 - 18:59
    e também a amplitude da classe,
    o intervalo de classe,
  • 18:59 - 19:01
    nós não temos
    regras rígidas,
  • 19:01 - 19:04
    mas nós podemos adotar
    alguns parâmetros aqui.
  • 19:04 - 19:05
    Então, são dois desafios:
  • 19:05 - 19:09
    o primeiro é a gente não escolher
    um número muito pequeno de classes,
  • 19:09 - 19:13
    senão a amplitude vai ficar
    muito grande, ou o contrário,
  • 19:13 - 19:17
    e, eventualmente, eu posso deixar
    uma tabela com muitas classes
  • 19:17 - 19:22
    de amplitudes muito pequenas, o que
    também pode não ser conveniente.
  • 19:22 - 19:26
    Para isso, então nós
    temos duas sugestões
  • 19:26 - 19:29
    para definir a amplitude
    da classe.
  • 19:29 - 19:33
    Temos um elemento aqui que é
    um elemento auxiliar, na verdade,
  • 19:33 - 19:35
    nesse cálculo,
    que é o valor de "k".
  • 19:35 - 19:39
    Esse "k" ainda não define,
    não é amplitude de classe,
  • 19:39 - 19:43
    mas ele vai nos ajudar
    a calcular a amplitude da classe.
  • 19:43 - 19:47
    Então, nós temos dois modelos
    estatístico que são utilizados,
  • 19:47 - 19:49
    podemos escolher
    qualquer um deles
  • 19:49 - 19:52
    e, dependendo do caso,
    a gente pode justificar
  • 19:52 - 19:56
    porque a gente preferiu
    um ou preferiu o outro.
  • 19:56 - 19:59
    Então, a primeira sugestão
    para o cálculo do valor k,
  • 19:59 - 20:01
    que é uma constante auxiliar,
  • 20:01 - 20:09
    é você fazer "1 + 3,322.log(n)"
    na base 10.
  • 20:09 - 20:10
    Esse "n" que aparece aqui
  • 20:10 - 20:16
    é o número de elementos da sua
    amostra, da sua base de dados.
  • 20:16 - 20:19
    Uma segunda opção
    para determinar o valor de k
  • 20:19 - 20:21
    é você fazer a raiz
    quadrada do n,
  • 20:21 - 20:25
    a raiz quadrada do número
    de elementos da amostra.
  • 20:25 - 20:30
    Uma vez que você determina
    o valor dessa constante auxiliar,
  • 20:30 - 20:35
    você vai aplicar um outro
    modelo estatístico que, aí sim,
  • 20:35 - 20:39
    vai determinar o valor
    da amplitude.
  • 20:39 - 20:44
    Para calcular a amplitude de cada
    uma das classes da sua tabela,
  • 20:44 - 20:48
    você faz essa formulinha aqui,
    você aplica essa formulinha.
  • 20:48 - 20:51
    A gente considera o maior valor
    que apareceu na sua base de dados,
  • 20:51 - 20:54
    o X máximo, menos o X mínimo,
  • 20:54 - 20:57
    isto é, o menor valor
    que apareceu na sua pesquisa.
  • 20:57 - 20:59
    Faz essa diferença aqui.
  • 20:59 - 21:01
    Essa diferença, nós chamamos
    de amplitude total,
  • 21:01 - 21:03
    é o maior valor que apareceu
    na pesquisa,
  • 21:03 - 21:06
    menos o menor valor
    que apareceu na pesquisa.
  • 21:06 - 21:11
    E aí, essa diferença você divide
    justamente pelo valor de k,
  • 21:11 - 21:17
    que você poderá ter obtido de uma
    dessas formas, você escolhe.
  • 21:17 - 21:22
    Uma vez que você determinou o k
    e que você determinou a amplitude,
  • 21:22 - 21:27
    aí sim você começa a organizar
    as classes de dados
  • 21:27 - 21:32
    e organizar a sua distribuição
    de frequências, consequentemente.
  • 21:32 - 21:34
    Vamos ver, então,
    aqui, um exemplo?
  • 21:34 - 21:36
    Veja só, nesse caso aqui,
    a gente tem 50 dados
  • 21:36 - 21:39
    que foram coletados
    sobre poluição sonora,
  • 21:39 - 21:42
    as medidas estão em decibéis
  • 21:42 - 21:45
    e aqui nós temos, então, essa
    grande quantidade de dados,
  • 21:45 - 21:50
    isto é, 50 valores que foram
    obtidos em uma certa pesquisa.
  • 21:50 - 21:54
    Agora, nós queremos organizar,
    a partir desses dados brutos,
  • 21:54 - 21:58
    uma tabela de dados
    com classes.
  • 21:58 - 22:03
    Para isso, nós vamos ter que definir
    quantas classes nós vamos utilizar
  • 22:03 - 22:06
    e qual será a amplitude
    de cada uma dessas classes.
  • 22:06 - 22:09
    Para determinar, então,
    o número de classes,
  • 22:09 - 22:14
    nós vamos optar por utilizar
    essa fórmula para o cálculo de k.
  • 22:14 - 22:15
    Como nós vimos,
  • 22:15 - 22:18
    há uma outra fórmula também
    que pode ser utilizada.
  • 22:18 - 22:22
    nessa opção de fórmula aqui,
    para determinar o valor de k,
  • 22:22 - 22:25
    que é o número de classes
    que você vai organizar,
  • 22:25 - 22:27
    você deve fazer
    a raiz quadrada
  • 22:27 - 22:30
    do número de elementos
    da sua amostra.
  • 22:30 - 22:32
    No exemplo que nós
    estamos falando,
  • 22:32 - 22:36
    foram coletados 50 valores,
    50 medições foram feitas.
  • 22:36 - 22:38
    Então, nós vamos fazer
    a raiz quadrada de 50,
  • 22:38 - 22:42
    que vai dar, aproximadamente,
    7,071,
  • 22:42 - 22:45
    e aí, nós podemos arredondar
    para o próximo número inteiro,
  • 22:45 - 22:48
    para o número inteiro
    mais próximo.
  • 22:48 - 22:52
    Então, veja só, o número inteiro
    mais próximo de 7,071 é o 7,
  • 22:52 - 22:57
    então nós vamos organizar
    uma tabela com 7 classes de dados.
  • 22:57 - 23:00
    Veja, assim você tem
    um referencial estatístico
  • 23:00 - 23:04
    para definir quantas
    classes você vai ter
  • 23:04 - 23:07
    na tabela de dados
    que você vai organizar.
  • 23:07 - 23:10
    Repare que o número de classes
    não é obtido de maneira aleatória,
  • 23:10 - 23:11
    você tem um modelo estatístico
  • 23:11 - 23:14
    que define essa
    quantidade de classes.
  • 23:14 - 23:16
    Uma vez que você já sabe
    a quantidade de classes,
  • 23:16 - 23:17
    você vai calcular, agora,
  • 23:17 - 23:21
    qual será a amplitude
    de cada uma dessas classes.
  • 23:21 - 23:23
    Para calcular amplitude,
    vamos fazer, então,
  • 23:23 - 23:26
    o maior valor que apareceu
    na pesquisa,
  • 23:26 - 23:32
    naquela tabela do slide anterior,
    o maior valor que apareceu foi o 71,9
  • 23:32 - 23:35
    e o menor valor que apareceu
    na pesquisa foi o 58.
  • 23:35 - 23:41
    Então, eu tenho uma base de dados
    com 50 valores que foram coletados,
  • 23:41 - 23:45
    o maior valor que apareceu foi 71,9
    e o menor valor que apareceu,
  • 23:45 - 23:49
    nessa base de dados aqui,
    de 50 valores, foi o 58.
  • 23:49 - 23:54
    Fazendo essa subtração dá 13,9
    e você divide pelo valor de k.
  • 23:54 - 23:59
    Já arredondado, aqui, para 7, essa
    divisão vai dar, aproximadamente, 2.
  • 23:59 - 24:02
    Isso significa que nós
    vamos organizar 7 classes,
  • 24:02 - 24:06
    isto é, 7 faixas
    de amplitude 2.
  • 24:06 - 24:10
    Veja, então, como
    fica essa tabela.
  • 24:10 - 24:11
    Como nós podemos notar,
  • 24:11 - 24:15
    o menor valor que apareceu
    na pesquisa foi o 58,
  • 24:15 - 24:21
    então a nossa primeira faixa
    de decibéis começa em 58,
  • 24:21 - 24:24
    e a amplitude da classe é 2,
  • 24:24 - 24:27
    o valor que a gente obteve
    aqui no slide anterior.
  • 24:27 - 24:30
    Então você faz 58 mais 2,
    que é a amplitude,
  • 24:30 - 24:33
    e, assim, você tem 60 decibéis,
  • 24:33 - 24:38
    de maneira que a primeira
    faixa vai de 58 a 60.
  • 24:38 - 24:41
    E aí, nós vamos na tabela
    verificar quantos valores
  • 24:41 - 24:45
    que foram obtidos na pesquisa
    ficam dentro dessa faixa aqui
  • 24:45 - 24:47
    que vai de 58 a 60.
  • 24:47 - 24:50
    Fazendo essa contagem
    lá naquela tabela,
  • 24:50 - 24:55
    a gente percebe que tem 5 valores
    que ficam dentro dessa faixa
  • 24:55 - 25:00
    e, dessa maneira, a gente continua
    a organizar as demais faixas.
  • 25:00 - 25:06
    De 58 a 60, aí terminou em 60,
    começa em 60 aqui, vai até 62,
  • 25:06 - 25:08
    já que a amplitude é 2.
  • 25:08 - 25:15
    Então, de 62 a 64, 64 a 66, até
    chegarmos aqui na última faixa,
  • 25:15 - 25:17
    que vai de 70 a 72.
  • 25:17 - 25:22
    Repare que você tem
    7 classes de dados,
  • 25:22 - 25:27
    que é justamente o valor
    de k que você obteve aqui,
  • 25:27 - 25:29
    o valor arredondado de k.
  • 25:29 - 25:33
    Repare, também, que cada uma
    das classes tem amplitude 2,
  • 25:33 - 25:38
    observe aqui, cada uma
    das classes tem amplitude 2.
  • 25:38 - 25:42
    Então, é dessa forma que
    a amplitude de classe é definida
  • 25:42 - 25:47
    e que a quantidade de classes
    também é definida
  • 25:47 - 25:49
    para uma determinada
    base de dados.
  • 25:49 - 25:51
    Veja que, por exemplo,
    aqui, observando a tabela,
  • 25:51 - 25:55
    a gente notou que há 15 valores
    que estão dentro dessa faixa
  • 25:55 - 25:58
    que vai de 66 a 68 decibéis,
  • 25:58 - 26:01
    no contexto que nós
    estamos falando.
  • 26:01 - 26:05
    Quando você soma cada
    uma dessas quantidades
  • 26:05 - 26:07
    que são chamadas
    de frequências absolutas,
  • 26:07 - 26:11
    você vai ter um total
    de 50 observações,
  • 26:11 - 26:17
    afinal de contas, foram 50 medições,
    50 dados foram levantados.
  • 26:17 - 26:20
    Observe que você tem
    uma modelagem estatística
  • 26:20 - 26:24
    que permite que você
    possa organizar as faixas
  • 26:24 - 26:27
    não de forma aleatória, mas
    de uma maneira organizada,
  • 26:27 - 26:32
    planejada, projetada por meio
    de modelos estatísticos.
  • 26:32 - 26:37
    Com esse exemplo, nós podemos
    notar que o número de classes
  • 26:37 - 26:38
    que você tem
    em uma tabela,
  • 26:38 - 26:42
    e também a amplitude
    de cada classe,
  • 26:42 - 26:44
    não são valores obtidos
    de maneira aleatória
  • 26:44 - 26:47
    ou feitos de forma aleatória,
    de qualquer forma,
  • 26:47 - 26:52
    na verdade, você tem modelos,
    fórmulas estatísticas
  • 26:52 - 26:55
    que nos permitem definir
    exatamente quantas classes
  • 26:55 - 26:58
    você vai ter em uma tabela
    de dados
  • 26:58 - 27:02
    e, também, qual é a amplitude
    de cada uma dessas faixas,
  • 27:02 - 27:04
    dessas classes de dados.
  • 27:04 - 27:08
    Então, basta utilizar os respectivos
    modelos matemáticos
  • 27:08 - 27:11
    que nós apresentamos aqui
    para que você possa determinar
  • 27:11 - 27:14
    o número de classes
    com que você vai trabalhar.
  • 27:14 - 27:18
    Tivemos aqui a oportunidade
    de conhecer esses dois tipos
  • 27:18 - 27:20
    de distribuições de frequências,
  • 27:20 - 27:23
    ou seja, esses dois
    tipos de tabelas.
  • 27:23 - 27:25
    As tabelas de dados
    estatísticos, então,
  • 27:25 - 27:27
    são organizadas em dois
    grandes tipos,
  • 27:27 - 27:31
    nós temos as tabelas de dados
    sem classes de dados,
  • 27:31 - 27:35
    sem faixas de valores,
    sem intervalos,
  • 27:35 - 27:39
    e temos as tabelas de dados,
    as distribuições de frequências
  • 27:39 - 27:44
    que apresentam faixas de dados,
    intervalos de dados, ou seja,
  • 27:44 - 27:45
    são as tabelas com classes.
Title:
ES CAP02 2025 VA01 DISTRIBUICOES DE FREQUENCIAS SEM CLASSES COM CLASSES
Video Language:
Portuguese, Brazilian
Duration:
27:49

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions