< Return to Video

PBL TSC ANO 02 FASE 03 2025 VIDEO EXTRA PITCH DATA STORM

  • 0:08 - 0:11
    Oi, eu sou Heloiza,
    estagiária de Data "Science.
  • 0:11 - 0:13
    Olá, eu sou a Sara,
    Cientista de Dados.
  • 0:13 - 0:15
    E nós somos da Data Storm.
  • 0:15 - 0:19
    Bom, no início de 2024, a minha
    insight procurou a FIAP
  • 0:19 - 0:23
    para ajudar a entender como
    a gente poderia utilizar IA e dados
  • 0:23 - 0:27
    para ajudar a prever a queda
    de energia na cidade de São Paulo.
  • 0:27 - 0:29
    Bom, a gente sabe
    que a cidade de São Paulo
  • 0:29 - 0:31
    sempre enfrentou
    muitos problemas
  • 0:31 - 0:34
    em relação a falta
    de energia elétrica.
  • 0:34 - 0:41
    Ano passado, em 2024, a gente teve
    um recorde de apagão histórico,
  • 0:41 - 0:44
    3 milhões de pessoas foram
    afetadas por esse apagão,
  • 0:44 - 0:48
    a gente teve um prejuízo
    de mais de R$ 400 milhões
  • 0:48 - 0:50
    por conta desse apagão,
  • 0:50 - 0:53
    então a gente sabe que é um problema
    frequente na nossa cidade,
  • 0:53 - 0:55
    e como a gente pode
    utilizar IA e dados
  • 0:55 - 0:57
    para a gente ajudar a prever
  • 0:57 - 1:00
    e ser proativo em relação
    a esse problema.
  • 1:00 - 1:02
    Bom, para resolver
    esse desafio,
  • 1:02 - 1:04
    a gente tinha como
    principal objetivo
  • 1:04 - 1:07
    trazer uma infraestrutura
    centralizada de dados
  • 1:07 - 1:10
    que pudesse organizar
    e padronizar dados climáticos,
  • 1:10 - 1:12
    de previsão de tempo,
  • 1:12 - 1:15
    de interrupção de energia elétrica
    de toda a região de São Paulo,
  • 1:15 - 1:16
    uma arquitetura,
    um pipeline de dados
  • 1:16 - 1:19
    que suportasse toda
    essa infraestrutura
  • 1:19 - 1:22
    e, além disso, um modelo preditivo
    que nos ajudasse a entender
  • 1:22 - 1:25
    quais seriam as próximas
    regiões mais afetadas,
  • 1:25 - 1:28
    onde a gente deveria focar
    e ter uma ação planejada
  • 1:28 - 1:32
    da equipe operacional da minha
    insight mais efetiva e mais acurada.
  • 1:32 - 1:35
    E para isso
    a gente utilizou diversas fontes de dados,
  • 1:35 - 1:39
    como dados públicos da Subprefeitura
    de São Paulo, do Geraldo Sampa, da
  • 1:40 - 1:42
    Dados Privados, também da Anatel, métricas
  • 1:42 - 1:45
    para a gente
    construir e desenvolver essa solução.
  • 1:45 - 1:46
    Pensando nisso,
  • 1:46 - 1:50
    nós criamos uma arquitetura de dados
    extremamente robusta e completa.
  • 1:51 - 1:54
    Ela trabalha com dados em tempo real
    e dados históricos.
  • 1:54 - 1:55
    Então os dados históricos,
  • 1:55 - 1:59
    eles entram na arquitetura
    através de Bates e os dados em tempo real.
  • 1:59 - 2:02
    Eles entram através de
    uma perícia questionada pelo airflow.
  • 2:03 - 2:07
    Na primeira camada a gente limpou
    bem por cima esses dados a camada roll.
  • 2:08 - 2:12
    Então tiramos só o
    que não era somente necessário
  • 2:12 - 2:16
    para conseguir armazenar
    eles dentro do Google Cloud
  • 2:16 - 2:20
    Plataform e só então conseguir trabalhar
    efetivamente em cima deles.
  • 2:20 - 2:25
    Na segunda camada, a camada transparente,
    nós pegamos esses dados já mais limpos
  • 2:25 - 2:28
    e refinamos eles de fato, para
    então integrá los
  • 2:29 - 2:33
    e construir a última camada de tratamento,
    que é a camada wi fi,
  • 2:33 - 2:38
    onde nós criamos uma tabela gigante
    com todos os dados necessários
  • 2:38 - 2:44
    já filtrados e prontos para serem jogados
    no nosso modelo de predição e treinado
  • 2:45 - 2:46
    nosso modelo de machine
  • 2:46 - 2:49
    learning
    e então conseguir trabalhar de fato
  • 2:49 - 2:52
    esses dados
    para uma visualização no Power BI.
  • 2:52 - 2:57
    O nosso modelo preditivo
    passou por alguns testes e no último
  • 2:57 - 3:01
    que eu li tbm
    nós decidimos que era o mais acurado.
  • 3:01 - 3:04
    Aqui nós temos uma matriz de confusão,
  • 3:04 - 3:07
    recall, acuracidade, precisão.
  • 3:07 - 3:08
    Mas o mais interessante
  • 3:08 - 3:13
    é falar sobre a matriz de confusão,
    onde aqui temos os testes de True False.
  • 3:13 - 3:15
    Verdade ou falso?
  • 3:15 - 3:18
    Onde eu digo se vai faltar
    e falta energia ou
  • 3:18 - 3:23
    eu digo se não vai faltar e falta energia,
    se vai faltar e não falta
  • 3:23 - 3:26
    e se não vai faltar
    e realmente não falta energia.
  • 3:26 - 3:31
    Olhando o quadrante, o azulzinho
    e o roxinho mais escuro,
  • 3:31 - 3:34
    nós vemos os dois números principais,
  • 3:34 - 3:38
    onde eu digo no azul que não vai faltar
    e ele falta é um número alto.
  • 3:39 - 3:42
    Mas pensando no negócio desse problema,
  • 3:43 - 3:46
    nos compensa mais deslocar uma equipe.
  • 3:46 - 3:50
    Quando eu falo que não vai faltar
    é falta do que é deslocar uma equipe.
  • 3:50 - 3:54
    Quando eu falo que vai faltar e não falta,
    é um dos focos da nossa solução
  • 3:54 - 3:58
    é a minimização de recursos
    e operacionais.
  • 3:58 - 4:02
    Então, por isso nós escolhemos um modelo
    que tem um erro menor
  • 4:02 - 4:07
    quando diz que vai locomover a equipe
    e ele erra.
  • 4:07 - 4:10
    Então e por isso o modelo vai de BM.
  • 4:10 - 4:14
    Bom, é para analisar todas essas
    resultados aí, para a gente entender
  • 4:15 - 4:18
    onde as equipes operacionais da mensagem
    poderiam atuar.
  • 4:18 - 4:21
    A gente desenvolveu um dashboard
    onde a gente mostra todo o histórico
  • 4:21 - 4:24
    que a gente tem,
    tanto de dados climatológicas
  • 4:24 - 4:27
    quanto de dados de interrupção
    de energia elétrica
  • 4:28 - 4:30
    e com os dados da previsão em tempo real,
  • 4:30 - 4:33
    da falha
    e da interrupção de energia elétrica.
  • 4:33 - 4:36
    Então, no nosso dashboard hoje
    a gente consegue ver, por exemplo,
  • 4:36 - 4:40
    qual é a média de previsão de interrupção
    de energia elétrica para São Paulo
  • 4:40 - 4:42
    nos próximos sete dias.
  • 4:42 - 4:44
    A gente consegue ver isso
    por datas também.
  • 4:44 - 4:47
    Então você tem um dia onde a equipe
    tem que planejar recursos a mais.
  • 4:48 - 4:51
    A gente consegue analisar isso
    por subprefeitura em um mapa de calor,
  • 4:51 - 4:54
    onde a gente consegue ver
    as regiões mais críticas.
  • 4:54 - 4:55
    Então já ir trazendo
  • 4:55 - 4:59
    com base nos dados climatológicas
    de interrupção de energia elétrica,
  • 4:59 - 5:02
    onde a equipe operacional
    deveria atuar mais forte.
  • 5:03 - 5:07
    Então a gente consegue também
    ver a média histórica para entender
  • 5:07 - 5:10
    o comportamento histórico
    de cada subprefeitura
  • 5:10 - 5:13
    e entender
    e ajudar e analisar esses pontos.
  • 5:13 - 5:17
    O ponto forte da nossa solução é essa
  • 5:17 - 5:20
    tabelinha aqui, onde nós ponderamos
  • 5:20 - 5:23
    qual local deve ser socorrido primeiro.
  • 5:23 - 5:24
    Assim, quer dizer.
  • 5:24 - 5:26
    Então aqui nós trazemos diversos dados
  • 5:27 - 5:29
    demográficos de
  • 5:29 - 5:34
    hospitais, escolas, creches,
    comunidades e etc.
  • 5:34 - 5:35
    E aqui nós ponderamos
  • 5:35 - 5:39
    por que não necessariamente onde mais
    chove e onde mais vai ser afetado.
  • 5:39 - 5:43
    Então a gente conseguiu trazer
    todos esses dados aqui para dentro também
  • 5:43 - 5:48
    e assim indicar onde as equipes de resgate
    e onde as operações devem ir
  • 5:48 - 5:51
    e tomar uma atitude assim, por exemplo.
  • 5:52 - 5:56
    E aqui a gente traz a visão do nosso MVP
    até onde a gente desenvolveu
  • 5:56 - 5:59
    e da proposta da nossa solução final,
    onde a gente poderia chegar
  • 5:59 - 6:00
    com possíveis investimentos.
  • 6:00 - 6:04
    Então, hoje
    a gente tem uma API que faz a previsão.
  • 6:04 - 6:08
    Como o nosso modelo
    vai de até sete dias de previsão
  • 6:08 - 6:11
    para todas as prefeituras de São Paulo
    e com uma possível investimento,
  • 6:11 - 6:14
    a gente conseguiria chegar em até 15 dias
    e ampliar isso
  • 6:14 - 6:18
    para gerar um melhor planejamento,
    inclusive operacional, para a equipe.
  • 6:18 - 6:20
    Então, saber qual
  • 6:20 - 6:23
    em qual período eu vou ter que deslocar
    recursos para qual região.
  • 6:23 - 6:26
    Então isso seria possível
    na nossa solução final também.
  • 6:26 - 6:29
    Além disso,
    a gente também teria a possibilidade de.
  • 6:29 - 6:32
    Hoje a gente traz a nível de subprefeitura
    esses dados.
  • 6:32 - 6:33
    Então, com o possível investimento,
  • 6:33 - 6:34
    a gente também poderia ter
  • 6:34 - 6:37
    uma granularidade maior
    e trazer tantos dados históricos a nível
  • 6:38 - 6:41
    de saber o que a ventura
    de interrupção de rede elétrica,
  • 6:41 - 6:45
    mas também os dados de climatologia
    em uma granularidade maior
  • 6:45 - 6:49
    e trazer uma previsão mais acurada
    para a região mais acurada de São Paulo,
  • 6:49 - 6:52
    trazendo assim
    até uma eficiência operacional
  • 6:52 - 6:52
    para a equipe
  • 6:52 - 6:56
    que está ali, atendendo as regiões
    que estão com falta de energia elétrica.
  • 6:57 - 6:57
    E, além disso,
  • 6:57 - 7:01
    a gente ainda teria como oportunidade
    de trazer para nós a solução final
  • 7:02 - 7:05
    retroalimentar os dados operacionais
    mensais,
  • 7:05 - 7:08
    para que a gente possa ter uma solução
    ainda mais eficaz.
  • 7:08 - 7:12
    Então, entender onde as equipes trazer
    os dados de feedback das equipes,
  • 7:12 - 7:13
    onde as equipes estão atuando
  • 7:13 - 7:17
    e a gente deveria começar, atua mais
    o tempo de deslocamento dessas equipes
  • 7:17 - 7:21
    para a gente ainda ter um planejamento
    ainda mais acurado e eficaz.
  • 7:21 - 7:22
    Para mim, site.
  • 7:22 - 7:26
    Essa foi a nossa solução final,
    porque além de desenvolvida em 2024,
  • 7:27 - 7:29
    gostaríamos de deixar aqui
    um agradecimento a todo o time
  • 7:29 - 7:32
    bem desse enorme
    e desejamos uma boa sorte.
Title:
PBL TSC ANO 02 FASE 03 2025 VIDEO EXTRA PITCH DATA STORM
Video Language:
Portuguese, Brazilian
Duration:
07:35

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions