< Return to Video

EADW CAP04 2025 VA0. AZURE INTRODUCAO DATA FACTORY

  • 0:00 - 0:01
    Azure Data Factory
  • 0:01 - 0:06
    é uma das principais ferramentas
    contempladas pela Microsoft Azure.
  • 0:06 - 0:08
    Vamos entender melhor
    como é que ela funciona
  • 0:08 - 0:12
    e quais são as principais vantagens
    que a gente pode tirar dela?
  • 0:20 - 0:23
    Para começar, vamos listar
    as principais vantagens
  • 0:23 - 0:25
    de utilizar o ADF.
  • 0:25 - 0:28
    A primeira delas é
    a possibilidade de conexão
  • 0:28 - 0:31
    com mais de 90
    interconectores.
  • 0:31 - 0:34
    E isso possibilita que a gente
    tenha um fluxo contínuo
  • 0:34 - 0:36
    desse tratamento de dados,
  • 0:36 - 0:41
    então o que antes a gente precisava
    de um sistema para ingerir os dados,
  • 0:41 - 0:44
    outro sistema só para fazer
    as transformações
  • 0:44 - 0:48
    e outro sistema só para fazer
    o tratamento desses dados,
  • 0:48 - 0:51
    hoje a gente consegue
    fazer isso em um fluxo só,
  • 0:51 - 0:56
    dentro de uma única ferramenta
    que a gente chama de Data Factory.
  • 0:56 - 0:59
    Outra vantagem é
    a interface amigável.
  • 0:59 - 1:03
    Hoje, o usuário está muito
    acostumado com o sistema Microsoft,
  • 1:03 - 1:07
    aquele sistema onde tem janelas
    em que você clica, arrasta
  • 1:07 - 1:09
    e usa poucos códigos,
  • 1:09 - 1:13
    o ADF vai te proporcionar
    essa mesma facilidade.
  • 1:13 - 1:19
    Então, isso faz com que diversas
    pessoas possam manipular a Azure
  • 1:19 - 1:21
    e fazer o tratamento dos dados,
  • 1:21 - 1:25
    além de uma grande codificação
    que não é mais necessária.
  • 1:25 - 1:30
    Outra vantagem que a gente
    possui é a orquestração avançada.
  • 1:30 - 1:33
    Orquestração é exatamente
    como a banda toca,
  • 1:33 - 1:38
    então são os comandos
    que a gente dá, as orientações,
  • 1:38 - 1:41
    de onde que o dado vem,
    para onde que o dado vai.
  • 1:41 - 1:44
    Então, como esse sistema
    todo é manipulado,
  • 1:44 - 1:47
    a gente chama
    de orquestração.
  • 1:47 - 1:49
    E isso tudo a gente
    consegue fazer
  • 1:49 - 1:53
    em uma única interface
    dentro do Data Factory.
  • 1:53 - 1:57
    E junto com essa vantagem,
    a gente vem com uma agregada,
  • 1:57 - 2:00
    que é a escalabilidade
    automática,
  • 2:00 - 2:03
    ou seja, à medida que o seu
    negócio vai crescendo,
  • 2:03 - 2:06
    não é necessário você
    aumentar o seu servidor
  • 2:06 - 2:09
    ou comprar ferramentas
    mais avançadas,
  • 2:09 - 2:14
    você consegue ir alugando
    mais espaços no seu servidor
  • 2:14 - 2:17
    e o seu negócio vai crescendo
    de forma automatizada.
  • 2:17 - 2:18
    Além disso,
  • 2:18 - 2:22
    a gente consegue fazer qualquer
    tipo de transformação de dados,
  • 2:22 - 2:26
    então é possível você
    ter a inserção de dados
  • 2:26 - 2:30
    vindo de uma plataforma
    completamente diferente
  • 2:30 - 2:32
    da entrega desses dados.
  • 2:32 - 2:36
    E essa transformação
    é feita no intervalo
  • 2:36 - 2:42
    dessa conexão entre os dados,
    já facilitando a análise final
  • 2:42 - 2:46
    e a entrega das estratégias
    de negócios.
  • 2:46 - 2:48
    E, para finalizar, isso
    tudo é feito dentro
  • 2:48 - 2:53
    de uma criptografia avançada
    conferida pela Microsoft,
  • 2:53 - 2:55
    então isso proporciona segurança
  • 2:55 - 2:58
    em todo esse processo
    de manipulação dos dados.
  • 2:58 - 3:01
    Mas onde tudo
    isso é utilizado?
  • 3:01 - 3:06
    Então, hoje, a gente usa
    em data warehouses avançados,
  • 3:06 - 3:08
    a gente usa
    no processo de ETL,
  • 3:08 - 3:11
    que é a extração, transformação
    e carga dos dados,
  • 3:11 - 3:14
    a gente usa para fazer
    a migração dos dados.
  • 3:14 - 3:16
    Então, é só lembrar
    que o Data Factory
  • 3:16 - 3:21
    é exatamente uma fábrica
    de dados, ou seja,
  • 3:21 - 3:23
    o dado é a nossa
    matéria prima principal.
  • 3:23 - 3:26
    Então, imagina isso como
    um paralelo de uma fábrica mesmo,
  • 3:26 - 3:28
    a gente tem a matéria prima,
  • 3:28 - 3:32
    a gente tem o processamento
    dessa matéria prima, ou seja,
  • 3:32 - 3:34
    a transformação disso,
  • 3:34 - 3:38
    e a entrega do produto final
    conforme o cliente necessita.
  • 3:38 - 3:41
    Então, nessa entregue final,
    a gente consegue utilizar
  • 3:41 - 3:46
    para aprendizagem de máquinas,
    para análises preditivas de dados,
  • 3:46 - 3:48
    para dashboards interativos,
  • 3:48 - 3:53
    enfim, a gente vai entregar conforme
    a estratégia de negócio solicitar.
  • 3:53 - 3:55
    Então, sempre
    que você precisar,
  • 3:55 - 3:59
    faz essa comparação
    com uma fábrica mesmo,
  • 3:59 - 4:02
    só que a gente está trabalhando
    com a principal matéria prima,
  • 4:02 - 4:03
    que são os dados.
  • 4:03 - 4:10
    Inclusive, a nomenclatura utilizada
    é muito similar a um sistema fabril,
  • 4:10 - 4:13
    então a gente vai
    ter os containers,
  • 4:13 - 4:17
    que são o principal local
    de transformação desses dados,
  • 4:17 - 4:21
    e, nesses containers, a gente vai
    colocar todas as informações
  • 4:21 - 4:22
    que a gente precisa.
  • 4:22 - 4:28
    Imagina assim: você tem um pedido
    sendo feito lá para a China,
  • 4:28 - 4:35
    esse processamento está sendo
    feito durante o transporte
  • 4:35 - 4:38
    que ocorre dentro do navio,
  • 4:38 - 4:40
    e essa entrega é
    feita aqui no Brasil,
  • 4:40 - 4:43
    conforme o solicitante
    brasileiro pediu.
  • 4:43 - 4:48
    Então, imagina a diferença que
    existe entre o Brasil e a China,
  • 4:48 - 4:51
    a diferença de origem e destino,
  • 4:51 - 4:55
    e toda essa transformação dos dados
    é feita durante esse transporte.
  • 4:55 - 5:00
    É por isso que a gente agrega muito
    essa nomenclatura de oleoduto
  • 5:00 - 5:04
    no lugar de pipeline,
    de gasodutos e de containers,
  • 5:04 - 5:07
    porque eles fizeram justamente
    essa comparação.
  • 5:07 - 5:09
    Então, como é que vai
    funcionar hoje?
  • 5:09 - 5:13
    Você puxa os dados
    de qualquer sistema,
  • 5:13 - 5:18
    conforme você está puxando
    e entregando esses dados,
  • 5:18 - 5:22
    automaticamente, você já está
    fazendo essa transformação
  • 5:22 - 5:24
    no meio do caminho.
  • 5:24 - 5:29
    E, para que isso funcione, a gente
    precisa orquestrar tudo isso,
  • 5:29 - 5:35
    essa orquestra normalmente é feita
    dentro do próprio sistema Windows,
  • 5:35 - 5:38
    mas um sistema que é
    muito amigável e fácil
  • 5:38 - 5:42
    de o usuário de qualquer
    departamento utilizar.
  • 5:42 - 5:45
    Para ilustrar tudo isso
    que a gente está falando,
  • 5:45 - 5:48
    vamos agora para essa figura
    entender exatamente
  • 5:48 - 5:52
    como é que o pipeline foi
    desenhado dentro do ADF.
  • 5:52 - 5:58
    Então, olha só, ADF, o próprio
    ícone dela já é uma fábrica.
  • 5:58 - 6:04
    E o pipeline, em uma tradução
    livre e até literal, é oleoduto.
  • 6:04 - 6:06
    Dentro desse pipeline
  • 6:06 - 6:10
    é que vão acontecer todas
    as transformações dos dados.
  • 6:10 - 6:15
    Então, vamos entender de onde
    e para onde vão os dados
  • 6:15 - 6:18
    e quais são as etapas
    que ele passa.
  • 6:18 - 6:19
    Na nossa primeira etapa,
  • 6:19 - 6:22
    a gente tem que fazer
    a ingestão desses dados,
  • 6:22 - 6:26
    e essa ingestão pode ser
    feita em qualquer formato.
  • 6:26 - 6:32
    A primeira coisa que a gente
    vai fazer é um link, ou seja,
  • 6:32 - 6:34
    uma etapa de linked service
  • 6:34 - 6:37
    para que a gente consiga
    transferir esses dados.
  • 6:37 - 6:41
    Então, seja lá qual
    o formato inicial que for,
  • 6:41 - 6:45
    a gente vai criar uma API
    para ingerir esses dados
  • 6:45 - 6:49
    e colocar os nossos dados dentro
    do nosso sistema de pipeline
  • 6:49 - 6:51
    aqui do ADF.
  • 6:51 - 6:54
    Depois, a gente vai fazer
    o nosso ETL, ou seja,
  • 6:54 - 6:57
    todas as transformações
    necessárias nos dados.
  • 6:57 - 7:02
    Então, vamos imaginar que
    o usuário final precise da idade,
  • 7:02 - 7:04
    só que, na ingestão dos dados,
  • 7:04 - 7:07
    a gente vem com a data
    de nascimento.
  • 7:07 - 7:10
    Então, essa primeira transformação
    vai ser justamente essa conta
  • 7:10 - 7:13
    da data menos
    a data de nascimento
  • 7:13 - 7:18
    e a entrega no formato, então,
    da idade que a pessoa tem.
  • 7:18 - 7:22
    Então, eu vou trazer esses meus
    dados no formato que ele estiverem,
  • 7:22 - 7:24
    por exemplo,
    data de nascimento,
  • 7:24 - 7:29
    vou criar uma API, são chamados
    "linked services", ou seja,
  • 7:29 - 7:34
    é como eu vou transformar
    os meus dados do meu sistema
  • 7:34 - 7:38
    e inserir no meu banco
    de dados dentro do pipeline.
  • 7:38 - 7:43
    Então, eu faço uma subtração da data
    atual menos a data de nascimento
  • 7:43 - 7:48
    e vou entregar a idade
    para o meu usuário final.
  • 7:48 - 7:52
    Assim que eu tenho esse
    resultado no meu dataset final,
  • 7:52 - 7:54
    eu vou transformar esses dados
  • 7:54 - 7:58
    para o formato que o meu
    usuário final quer
  • 7:58 - 8:03
    e aí, ele vai consumir e gerar
    estratégia de negócios.
  • 8:03 - 8:07
    Então, agora você já entendeu
    quais são as principais vantagens
  • 8:07 - 8:11
    que o ADF possui
    e, principalmente,
  • 8:11 - 8:17
    como esse pipeline de dados
    funciona e como ele vai ingerir,
  • 8:17 - 8:21
    transformar e entregar
    os dados para o usuário final.
Title:
EADW CAP04 2025 VA0. AZURE INTRODUCAO DATA FACTORY
Video Language:
Portuguese, Brazilian
Duration:
08:25

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions