< Return to Video

EADW CAP04 2025 VA0. AZURE INTRODUCAO DATA FACTORY

  • 0:00 - 0:02
    Em Jeri Beta Factory
  • 0:02 - 0:06
    é uma das principais ferramentas
    contempladas pela Microsoft.
  • 0:07 - 0:09
    Vamos entender melhor
    como é que ela funciona
  • 0:09 - 0:12
    e quais são as principais vantagens
    que a gente pode tirar dela.
  • 0:20 - 0:21
    Para começar,
  • 0:21 - 0:25
    vamos listar as principais
    vantagens de utilizar o ADF.
  • 0:25 - 0:28
    A primeira delas
    é a possibilidade de conexão
  • 0:28 - 0:31
    com mais de 90 inter conectores.
  • 0:31 - 0:35
    Isso possibilita com que a gente
    tenha um fluxo contínuo
  • 0:35 - 0:36
    desse tratamento de dados.
  • 0:36 - 0:40
    Então, o que antes
    a gente precisava de um sistema
  • 0:40 - 0:44
    para gerir os dados, outro sistema
    só para fazer as transformações
  • 0:44 - 0:48
    e outro sistema só para fazer
    o tratamento desses dados.
  • 0:48 - 0:51
    Hoje a gente consegue fazer isso
    num fluxo só,
  • 0:51 - 0:56
    dentro de uma única ferramenta
    que a gente chama de Data Factory.
  • 0:56 - 0:59
    Outra vantagem
    é a interface amigável.
  • 0:59 - 1:02
    Hoje,
    o usuário está muito acostumado
  • 1:02 - 1:06
    com o sistema Microsoft,
    aquele sistema onde tem janelas
  • 1:06 - 1:09
    em que você clica, raspa
    e usa poucos códigos.
  • 1:10 - 1:13
    O ADF ele vai te proporcionar
    essa mesma facilidade.
  • 1:13 - 1:16
    Então isso faz com que diversas
    pessoas
  • 1:16 - 1:21
    possam manipular
    e fazer o tratamento dos dados,
  • 1:21 - 1:25
    além de uma grande codificação
    que não é mais necessária.
  • 1:25 - 1:29
    Outra vantagem que a gente possui
    é a orquestração avançada.
  • 1:30 - 1:33
    Orquestração
    é exatamente como a banda toca,
  • 1:33 - 1:36
    então são os comandos
    que a gente dá,
  • 1:36 - 1:41
    as orientações da onde que o dado
    vem para onde que o dado vai.
  • 1:41 - 1:44
    Então, como esse sistema todo
    ele é manipulado?
  • 1:45 - 1:47
    A gente chama isso de orquestração.
  • 1:47 - 1:51
    Isso tudo a gente consegue fazer
    numa única interface
  • 1:51 - 1:53
    dentro do datacenter.
  • 1:53 - 1:57
    E junto com essa vantagem,
    a gente vem com uma agregada,
  • 1:57 - 2:00
    que é a escalabilidade automática.
  • 2:01 - 2:04
    Ou seja, à medida que o seu negócio
    vai crescendo, não é necessário
  • 2:04 - 2:09
    você aumentar o seu servidor ou
    comprar ferramentas mais avançadas.
  • 2:10 - 2:14
    Você consegue e alugando
    mais espaços no seu servidor
  • 2:14 - 2:17
    e o seu negócio vai crescendo
    de forma automatizada.
  • 2:18 - 2:18
    Além disso,
  • 2:18 - 2:22
    a gente consegue fazer qualquer
    tipo de transformação de dados.
  • 2:23 - 2:26
    Então, é possível
    você ter a inserção de dados
  • 2:26 - 2:29
    vindo de uma plataforma
    completamente diferente
  • 2:30 - 2:32
    da entrega desses dados.
  • 2:32 - 2:35
    E essa transformação, ela é feita
  • 2:35 - 2:39
    no intervalo dessa conexão
    entre os dados,
  • 2:39 - 2:42
    já facilitando a análise final
  • 2:43 - 2:46
    e a entrega
    das estratégias de negócios.
  • 2:46 - 2:49
    E para finalizar, isso tudo
    é feito dentro de uma criptografia
  • 2:49 - 2:53
    avançada conferida pela Microsoft.
  • 2:53 - 2:55
    Então, isso proporciona a segurança
  • 2:55 - 2:58
    em todo esse
    processo de manipulação dos dados,
  • 2:58 - 3:01
    mas é o de que tudo
    isso é utilizado.
  • 3:01 - 3:07
    Então, hoje a gente usa em Data
    warehouse os avançados, a gente usa
  • 3:07 - 3:11
    no processo de ETL, que é extração,
    transformação e carga dos dados.
  • 3:11 - 3:14
    A gente usa
    para fazer a migração dos dados.
  • 3:14 - 3:17
    Então é só lembrar
    que o datacenter, ele é exatamente
  • 3:17 - 3:20
    uma fábrica de dados, ou seja,
  • 3:21 - 3:24
    o dado é a nossa matéria
    prima principal.
  • 3:24 - 3:27
    Então imagina isso
    como paralelo de uma fábrica mesmo.
  • 3:27 - 3:30
    A gente tem a matéria prima,
    a gente tem o processamento
  • 3:30 - 3:34
    dessa matéria prima, ou seja,
    a transformação disso
  • 3:34 - 3:38
    é a entrega do produto final
    conforme o cliente necessita.
  • 3:39 - 3:42
    Então, nesse entregue final,
    a gente consegue utilizar
  • 3:42 - 3:46
    para aprendizagem de máquinas,
    para análises preditivas de dados,
  • 3:46 - 3:50
    para dashboards interativos, enfim,
    a gente vai entregar
  • 3:50 - 3:53
    conforme a estratégia de negócio
    solicitar.
  • 3:53 - 3:57
    Então, sempre que você precisar
    fazer essa comparação
  • 3:57 - 3:59
    entre uma fábrica mesmo,
  • 3:59 - 4:02
    só que a gente está trabalhando
    com a principal matéria prima
  • 4:02 - 4:06
    que são os dados,
    inclusive a nomenclatura utilizada.
  • 4:07 - 4:10
    Ela é muito similar
    a um sistema fabril.
  • 4:10 - 4:13
    Então
    a gente vai ter os containers,
  • 4:13 - 4:17
    que é o principal local
    de transformação desses dados.
  • 4:17 - 4:21
    E nesses contêineres a gente
    vai colocar todas as informações
  • 4:21 - 4:22
    que a gente precisa.
  • 4:22 - 4:25
    Imagina assim Olha, você tem uma
  • 4:25 - 4:28
    um pedido sendo feito lá pra China
  • 4:28 - 4:32
    e esse processamento
    ele está sendo feito
  • 4:32 - 4:38
    durante o transporte
    ou que ocorre dentro do navio.
  • 4:38 - 4:40
    E essa entrega é feita aqui
  • 4:40 - 4:43
    no Brasil, conforme o solicitante
    brasileiro pediu.
  • 4:44 - 4:48
    Então imagina a diferença
    que existe entre o Brasil e a China
  • 4:48 - 4:52
    e a diferença de origem e destino
    e toda essa
  • 4:52 - 4:53
    transformação dos dados?
  • 4:53 - 4:56
    Ela é feita
    durante esse transporte.
  • 4:56 - 5:00
    Por isso que a gente agrega
    muito essa nomenclatura de oleoduto
  • 5:00 - 5:04
    no lugar de pipeline de gás e dutos
    e de containers,
  • 5:04 - 5:07
    porque eles fizeram justamente essa
    comparação.
  • 5:07 - 5:09
    Então, como é que vai funcionar
    hoje?
  • 5:09 - 5:13
    Você puxa os dados
    de qualquer sistema
  • 5:14 - 5:18
    conforme você está puxando
    e entregando esses dados
  • 5:18 - 5:21
    automaticamente
    você já está fazendo
  • 5:21 - 5:24
    essa transformação
    no meio do caminho.
  • 5:24 - 5:27
    E para que isso funcione,
    a gente precisa
  • 5:27 - 5:29
    porque extrair tudo isso?
  • 5:29 - 5:30
    Essa orquestra
  • 5:30 - 5:34
    normalmente ela é feita dentro
    do próprio sistema Windows,
  • 5:35 - 5:39
    mais um sistema
    que é muito amigável e fácil
  • 5:39 - 5:42
    do usuário
    de qualquer departamento utilizar.
  • 5:43 - 5:45
    Para ilustrar tudo isso
    que a gente está falando.
  • 5:45 - 5:48
    Vamos agora para essa figura
    e entender exatamente
  • 5:48 - 5:51
    como é que o pipeline foi desenhado
    dentro do ADF.
  • 5:52 - 5:53
    Então, olha só.
  • 5:53 - 5:57
    ADF O próprio ícone dela
    já é uma fábrica, né?
  • 5:58 - 6:01
    E o pipeline, numa tradução livre
  • 6:01 - 6:06
    e até literal e oleoduto
    dentro desse pipeline
  • 6:06 - 6:10
    é que vão acontecer
    todas as transformações dos dados.
  • 6:10 - 6:13
    Então vamos entender da onde.
  • 6:13 - 6:17
    Para onde vão os dados e quais são
    as etapas que ele passa.
  • 6:18 - 6:21
    Na nossa primeira etapa,
    a gente tem que fazer a ingestão
  • 6:21 - 6:26
    desses dados e essa ingestão
    pode ser feita em qualquer formato.
  • 6:26 - 6:32
    A primeira coisa que a gente
    vai fazer é fazer um link, ou seja,
  • 6:32 - 6:36
    uma etapa de linked services
    para que a gente consiga transferir
  • 6:36 - 6:38
    esses dados.
  • 6:38 - 6:40
    Então,
    seja lá qual o formato inicial
  • 6:40 - 6:45
    que for, a gente vai criar uma API
    para ingerir esses dados
  • 6:45 - 6:47
    e colocar os nossos dados dentro
  • 6:47 - 6:51
    do nosso sistema de pipeline
    aqui do ADF.
  • 6:51 - 6:54
    Depois a gente
    vai fazer o nosso ETL, ou seja,
  • 6:54 - 6:57
    todas as transformações
    necessárias nos dados.
  • 6:57 - 7:01
    Então vamos imaginar que
    o usuário final precise de idade.
  • 7:02 - 7:06
    Só que na injeção dos dados a gente
    vem com a data de nascimento.
  • 7:07 - 7:09
    Então essa primeira transformação
    vai ser justamente
  • 7:09 - 7:13
    essa conta da data,
    menos a data de nascimento
  • 7:14 - 7:17
    e a entrega no formato
    então de idade que a pessoa tenha.
  • 7:18 - 7:21
    Então eu vou trazer
    esses meus dados no formato
  • 7:21 - 7:24
    que ele tiver, como por exemplo
    data de nascimento.
  • 7:24 - 7:26
    Vou criar uma API.
  • 7:26 - 7:29
    São chamados
    Linked Services, ou seja,
  • 7:30 - 7:34
    é como eu vou transformar
    os meus dados do meu sistema
  • 7:34 - 7:38
    e inserir no meu banco de dados
    dentro do pai pilim.
  • 7:38 - 7:43
    Então eu faço uma subtração da data
    atual, menos a data de nascimento
  • 7:43 - 7:48
    e vou entregar a idade
    para o meu usuário final.
  • 7:48 - 7:52
    Assim que eu tenho esse resultado
    no meu dataset final,
  • 7:53 - 7:56
    eu vou transformar esses dados
    para o formato que o meu
  • 7:56 - 7:57
    usuário final quer
  • 7:58 - 7:59
    e aí ele vai
  • 7:59 - 8:02
    consumir
    e gerar estratégia de negócios.
  • 8:03 - 8:07
    Então agora você já entendeu
    quais são as principais vantagens
  • 8:07 - 8:11
    gens que o ADF possui e,
    principalmente,
  • 8:11 - 8:16
    como esse pipeline de dados
    funciona e como ele vai
  • 8:16 - 8:21
    ingerir, transformar e entregar os
    dados para o usuário final.
Title:
EADW CAP04 2025 VA0. AZURE INTRODUCAO DATA FACTORY
Video Language:
Portuguese, Brazilian
Duration:
08:25

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions