DW, duas letrinhas poderosas cuja combinação faz muita diferença no mundo dos dados. Aliás, é justamente esse armazém de dados que empoderam as organizações no seu processo de tomada de decisão. Muitas empresas primeiro tomam as suas decisões para depois olhar para os dados buscando ratificá-las. Mas para ser data-driven de fato, primeiro você olha para os dados, e então depois você faz uma tomada de decisão muito mais assertiva. Eu sou a Tassiana, sou gestora na área de dados e analytics em uma startup de Inteligência Artificial, a Tribo IA, sou também professora e coordenadora de MBA aqui na FIAP. E é justamente para falar sobre tomada de decisão que eu estou aqui com o meu querido Bruno Passos, que já tem uma vasta experiência nesse mercado. E eu queria que você se apresentasse para o nosso aluno e contasse quando que a tomada de decisão analítica entrou aí na sua carreira. Eu trabalho com dados há mais de dez anos, e é um grande prazer estar aqui com a professora Tassiana. Já foi minha professora. Eu acho que eu entrei como a maioria das pessoas acabaram entrando no mundo de dados, que é como um projeto de DW na empresa. Grudei ali com os especialistas. Fazia parte de um time de negócio fazendo upstream, o entendimento, uma parte também muito interessante de levantamento de requisitos, e fui entrando numa parte mais técnica. Hoje eu trabalho como squad líder no Bradesco em inovação e Dados, e estamos rompendo a barreira dos dados, e vamos falar um pouco de DW. Bacana, Bruno. Essa combinação inovação e dados é muito poderosa, né? Como nós podemos... Pensando aqui em criar um trilho de entendimento para o nosso aluno, como podemos definir esses dados analíticos? Dados analíticos são dados que estão disponíveis para serem explorados, analisados. Eles vão responder questões de negócio, questões estratégicas da empresa, se bem explorados. Tem toda uma arquitetura e um contexto por trás disso tudo, mas o final dele é responder questões da organização. Bacana, bacana. Em termos práticos, Bruno, para o nosso aluno entender que isso vai fazer a diferença lá no contexto corporativo mesmo, hoje, você ali na sua liderança, gestão, na sua atuação com dados, em que momento você precisa ir lá e acionar a sua ferramenta, a sua plataforma de análise de dados? Hoje nós utilizamos o dado para facilitar a vida do nosso time comercial. Então nós utilizamos esse dado analítico de uma maneira bem granular para fazer predições e realmente melhorar a vida do comercial, fazendo com que ele visite uma loja correta, que ele tenha um índice de assertividade no dia a dia dele. Então nós fazemos predições, modelos estatísticos, para poder melhorar a vida do comercial. Bruno, nós temos hoje uma série de tecnologias, ferramentas, enfim, mas me parece que o DW é o coração de tudo isso, né? Como ele funciona? Vamos começar a mostrar ali para o nosso aluno quais seriam os caminhos. Vou construir um Data Warehousing, preciso ter uma equipe técnica por trás disso? Como eu me organizo num projeto desse tipo? O DW, é importante sempre explorar. Antes de você sair fazendo a construção, para que ele vai servir, que respostas você precisa obter através dos dados, quais são as especificidades de cada departamento, e como você vai utilizar. Claro que você precisa de uma equipe de negócio para auxiliar em toda essa estrutura do Data Warehouse. Para você conseguir transformar os dados, colocar regras de negócio, você precisa de pessoas com um viés um pouco mais técnico para fazer a ingestão dessas informações. E sempre tem aquelas pessoas que têm mais habilidade do UX, de prototipar, de montar relatórios, dashboards. Então é um caminho de construção em relação ao profissional que tem oportunidade para todos Legal falarmos para o nosso aluno então, né, Bruno, que o DW é um conceito que apoia a tomada de decisão. Em termos práticos, quando pensamos um Data Warehouse, o que temos ali dentro são KPIs de dimensões, não mais que isso. E isso vai ser sempre superimportante dentro das empresas. Mas aí tem toda a questão do ferramental, do trilho de construção, do perfil profissional e tudo mais, para materializar isso. Mas não é uma ferramenta, né? Não dá para dizer que é simplesmente uma ferramenta, né? E aí tem uma questão aqui de definição, só para não deixar o nosso aluno confuso quando ele se deparar com as buzzwords, e os termos e tudo mais. Se eu coloco lá o "ing" no termo, muda alguma coisa? Apesar do nome ser praticamente igual às definições, e se você ler literalmente é igual, mas é diferente. O Data Warehousing tem uma amplitude maior porque é a concepção lá desde o início, trazer os dados lá do transacional, daqueles sistemas de origem, do sistema financeiro, se for um supermercado, o sistema que passa lá do caixa, e engloba até o processo da confecção de um dashboard, de um relatório. Então vamos dizer que o Data Warehouse sem o ing no final é um subconjunto dentro desse processo. Ele é um ambiente dentro de um banco de dados onde armazena essas informações de negócio. Então é um subconjunto de todo esse processo. Bacana. E com o ing, aí é a esteira inteira, né? A esteira inteira. Perfeito. Se não prestarmos atenção, nós confundimos, né, e de repente acha que um é sinônimo do outro. Se não falar o ing no final, no ouvido do brasileiro passa batido. Boa! Se você fosse hoje, Bruno, montar uma squad para compor um DW... Muitas organizações já tem o seu Data Warehouse. Temos feito o BI... Nasceu há boas décadas atrás. Então, quando você pega, por exemplo, o Bradesco, uma grande financeira, necessariamente eles já têm uma estrutura de tomada de decisão. De repente, se estivermos falando ali de uma startup, aí sim é uma empresa que está começando a fazer os seus registros transacionais e a compor a sua base analítica. Então vamos pensar num cenário mais novo. Se você estivesse ali na liderança de uma squad, quem você traria? Qual é o perfil profissional para atuar, na criação mesmo, de uma solução de Data Warehouse? Para mim, sempre existe a necessidade de antes de você realmente conceber e prototipar toda a arquitetura, entender com os responsáveis, com a gestão mais executiva, o que a empresa busca através dos dados, para definirmos então que tipo de arquitetura. Se vamos partir para um DW, ou se a empresa vai fazer um investimento numa cloud, se vamos para um lake, se está interessado em minerar dados. Agora, se for realmente um Data Warehouse, com certeza muitas pessoas de negócio, um profissional de ingestão de dados, um profissional de negócio para fazer todo o upstream, o levantamento de requisitos, né? E é importante ter um profissional para fazer toda essa parte de montar a ingestão dessa informação, aquelas três letrinhas lá, de extração, transformação, e a carga de tudo isso. Então eu traria esses três tipos de perfis: uma pessoa relacionada ao negócio, uma pessoa que trabalha com ingestão de dados, para fazer toda essa parte de arquitetura, das três letrinhas, que poderemos passar depois por elas, e alguém que tem habilidades de fazer a confecção de um dashboard, de construir relatórios, fazer estudos. Bacana. Então, no warehousing, nós temos levantamento de requisitos para responder as dores de negócio. Na modelagem, falando techniquêz, nós chamamos de levantar os fatos, o que se quer saber, não é isso? E aí tem uma conexão muito grande com o negócio. Em paralelo a isso, de repente um arquiteto... Hoje nós temos uma série de arquiteturas, Lambda, Kappa, tudo para tomada de decisão, malhas de dados, data mesh, data product, enfim. Ai talvez seja um papo para um outro vídeo. Mas sem dúvida, um arquiteto ali para para olhar. Você falou do... Só recapitulando para o nosso aluno, né? Você falou do ETL, que é uma parte dolorida, né, Bruno? Porque tem... É... Limpeza, tratamento dos dados... Não é isso? É, é o trabalho sujo, né? Eu estou brincando, não é o trabalho sujo. Na verdade é uma profissão bem legal, um engenheiro de dados ali, que vai fazer toda essa parte de ingestão. Ele vai capturar as informações dos sistemas transacionais. E aí, com a ajuda dessas pessoas de negócio, ele vai aplicar todas as regras que foram definidas e vai fazer o carregamento dessas informações para dentro desse Data Warehouse. Então ele move o engenho desse processo. E aí tem uma dor de qualidade de dados. Tem uma estatística que diz que menos de 10% das bases de dados são, de fato, consideradas qualificadas hoje. Então nós temos essa esteira com tantos profissionais... É um superprojeto, e às vezes entra sujeira, e sai sujeira colorida. Eu brinco com os alunos do outro lado, porque o dado não entra, de fato, muito bem qualificado, e nessa fase do ETL, nós temos muita dificuldade de fazer o quality, o cleansing dos dados, né Qualidade de dados hoje já não é mais uma dor técnica. É uma dor de negócio. Porque se eu não consigo resolver, eu não respondo às minhas perguntas de negócio. Você brincou ali no começo, que é trabalho sujo porque é trabalhoso, mas é estratégico, essa fase de combinar, agregar, calcular os dados e conseguir levá-los para um nível que eles, de fato, respondam as perguntas com assertividade. Você, como gestor, sabe, né, Bruno? Se o meu DW não for bem preparado, o gestor começa a burlar o sistema, e aí ele baixa aquilo no Excel, dá uma ajustada, vai no feeling, como eu brinquei aqui no início do nosso papo. As empresas não são data-driven, né? Elas tomam as decisões e depois até enviesam os dados que é para dizer que tomou a decisão certa, quando deveria ser o contrário. Eu faço aquilo que o dado me direciona a fazer. Mas que tudo isso está nessa fase do ETL, que parece tão técnico, mas que tem essa questão de qualidade que precisa ser pensada ali, inclusive pela gestão do projeto, né? Total. Eu não vou falar que o quality é o principal. Eu acho que é o principal ofensor sim, é o principal ofensor. Porque é igual o que você comentou. A informação vem com um nível de tratamento mínimo e você pode organizar essas informações e tratar um campo nulo, de repente transformar ali as cinco variáveis de São Paulo, São Paulo com "S", São Paulo só com o "SP", e tratar essas informações. Mas, por muitas vezes, você não consegue identificar se existe um padrão errado de informação lá dentro. Por exemplo, eu posso dizer que numa coluna deve vir uma descrição de 20 caracteres. E ali é uma é uma coluna para ver o modelo de um veículo, mas de repente vem o nome de uma cidade. É muito difícil o quality identificar algumas coisas que vêm da origem. Você até consegue identificar, né? Então é um trabalho que realmente, na concepção do upstream , toda a parte ali da montagem da arquitetura, tem que se pensar nessas questões de quality para começar realmente a transformar isso num dado de qualidade. É muito difícil 100% das informações estarem... Estamos usando um exemplo de banco, que tem mais de 90 sistemas transacionais, e nem tudo se conversa... Igual eu comentei aqui, um sistema coloca a cidade de um jeito e um outro sistema de outro. Você consegue fazer essas correções. Mas se existe um problema na articulação dos dados, um campo texto aonde alguém pode errar alguma coisa, é bastante sensível, é bem complicado. Eu acho que esse é o maior ofensor dentro de um DW. Bom ponto, é um super desafio, né? E aí você falou que depois da camada de consumo tem ali um analista de BI, talvez seja esse o melhor nome, para construir DataViz. Você mencionou UX, porque tem um pouco de como eu crio ali o meu storytelling, como eu capto as questões mais cognitivas, né, para onde as pessoas olham, o que chama a atenção, o uso de cores e tudo mais. Isso é superimportante, é digno de uma disciplina inteira, né? E de repente, Bruno, também um pouco de analytics ali, no sentido mais estatístico mesmo. Cabe ali uma correlação estatística, uma estatística mais descritiva, até preditiva, né? Dá para começar a fazer algumas combinações de KPIs, né? Sim, e dá para explorar realmente. Além da análise descritiva, dependendo da granularidade de dados, você realmente consegue fazer algum tipo de predição, começar a trabalhar um dashboard com uma análise diagnóstica, criar correlação, fazer algumas análises e estudos de churn, por exemplo. Legal. E em cima do UX, é muito importante, né? Toda essa estrutura tem que sair lá na frente em algo que faça sentido para quem vai ler. Então o UX hoje, a parte de UI também, estão presentes nos profissionais que trabalham com DataViz para achar a melhor maneira de divulgar essa informação para melhorar a leitura de quem vai consumir o dado. E se você estivesse começando a sua carreira agora, querendo entrar no clubinho dos dados... Não sei se é um clube fechado ou não. Aí é você que me diz, tá? Por onde que você começaria? Porque falamos de arquiteto, de engenheiro, de analista, de UX. Muitos caminhos, né? Mas eu imagino que tem aí um caminho mais fácil de entrar. Porque talvez a arquitetura não seja, né? A arquitetura é uma visão mais holística, Já tem que ter alguma bagagem de carreira. Dê uma dica aí para o nosso aluno começar. Eu vou dar uma dica prática, que, na verdade, é a minha própria experiência, que foi trabalhando com dados voltado para negócio, aquele cara que faz o upstream. Então, quando você se senta ao lado de um engenheiro para você passar todas aquelas regras e ajudá-lo a criar uma arquitetura, porque ele não cria sozinho, ele precisa da sua ajuda para definir os melhores caminhos. você começa a ter visão desses dois processos, um processo mais técnico e um processo de negócio, que é o que realmente falta no mercado, né, pessoas que não têm só um viés técnico, que é excelente quando uma pessoa executa a parte técnica, mas se ela tem o feeling de negócio, ela consegue entrar em caminhos e tomar decisões bem interessantes. Então eu começaria como eu comecei, com a parte de negócio na construção de um Data Warehouse. Boa dica, né, é um bom começo. Aliás, tivemos uma onda recente... Não é muito a minha praia, mas eu vou arriscar falar aqui do "dev full stack"... Que é aquele profissional back-end, front-end... Full, né? E eu tenho percebido, e não sei se você percebe, esse mesmo movimento no contexto de dados. Agora nós temos um analytics engineer, que me parece que é essa fusão desse profissional de análise de dados, que entende de Python, que entende também de SQL, mas que se vira bem no desenvolvimento, se precisar, para além da análise e da consulta interativa dos dados. Se precisar montar uma esteira, fazer efetivamente a engenharia, ele consegue. Ele consegue estar nos dois momentos, na engenharia e na análise dos dados. Talvez seja uma uma tendência para o nosso aluno olhar também. E na camada executiva? Estamos falando ali no técnico, olhando para o negócio, quais são as preocupações na camada executiva? Às vezes até quando vamos montar um dash, temos que nos perguntar se é mais tático, se é mais executivo. É importante porque o nível executivo tem algumas necessidades. Diferente de dashboards voltados para o operacional, para o tático, ele precisa de respostas num período curto de tempo de execução dessas informações, e de indicadores estratégicos onde ele possa tomar uma decisão rápida sem precisar fazer grandes leituras. Costumamos falar que tem que ter um storytelling, todo um contexto. Tem que ter também para a camada executiva, mas uma coisa muito mais enxuta, onde ele bata o olho e consiga tomar uma ação. Sim, sim. Em contrapartida, de repente, o período histórico deva ser maior, mais resumido, mas um período histórico maior, se estivermos falando de um planejamento mais estratégico, né? Eu percebo que, no tático, no operacional, eu estou olhando muito para a minha esteira ali, para o meu dia a dia, é pensar no amanhã, de repente é um... - Eu não quero que tenha uma... - Um monitoramento, né? Isso. Eu não quero que tenha uma quebra de estoque, então eu estou olhando para as minhas compras da semana que vem. E é isso. Agora, quando eu estou falando da camada executiva, de repente é o meu planejamento anual, ou eu estou norteando os próximos anos ali da minha organização, e aí eu tenho que, de repente, olhar para um período histórico um pouco maior. Pode ser o caso também para diferenciarmos um pouco o estratégico do tático. Gente, papo superbom. Começamos aqui conceituando o mundo de Business Intelligence. O Bruno trouxe aspectos de negócio. Aliás, a dica do Bruno foi começar por negócio e depois abarcar ali a parte técnica. E agora, como tudo o que é bom dura pouco, para fecharmos aqui a nossa conversa, dicas, dicas. Tem alguma dica preciosa de estudo, de caminhos, para o nosso aluno que está entrando nesse mundo da tomada de decisão? A minha percepção, não só para as pessoas que já já trabalham com isso, mas que estão entrando na área, é começar a olhar a tipos de arquiteturas e de propostas diferentes de como disponibilizar o dado, igual a professora Tassiama falou, de Data Mesh, de várias outras ferramentas voltadas para cloud, lakehouse, data lake, para realmente saber que universo você quer ir, se é um universo também de mineração de dados. Se você tem um viés mais matemático, estatístico, e gosta de explorar, minerar esse dado, também é um caminho. É um caminho não tão recente, mas recente em relação à toda essa estruturação de dados, porque estamos falando de Data Warehouse. E hoje, a concepção do Data Warehouse, o que estamos falando aqui, das profissões e dos métodos de como criar toda arquitetura, é importante para quem está querendo entrar na área enxergar o cenário como um todo, porque existem várias possibilidades, além do Data Warehouse, né, outras estruturas, mas estruturas que você acaba fazendo um formato híbrido com Data Warehouse. E você pode entrar num outro viés, matemático, estático, que trabalha essas informações olhando para frente, criando predições, criando prescrições. É um mundo muito vasto, muito vasto mesmo. Então, quando for estudar, olha no todo em relação ao dado para você enxergar onde você se encaixa melhor. Fantástico, Bruno. Gente, só esses últimos termos que ele usou... Ele falou de product, lake house, arquiteturas híbridas... Já dá horas aí, para não dizer anos, de estudo. Então dicas boas para vocês se aprofundarem ainda mais aqui no nosso conteúdo. É importante dizer, pessoal, que às vezes nós falamos DW, e isso soa como algo antigo, porque, de fato, nós fazemos isso há muito tempo. Agora, é o seguinte: as tecnologias passam, né, e às vezes eu até sinto a TI muito cíclica. Descentraliza, centraliza, vai de um extremo a outro, num contexto de agilidade. Está tudo muito rápido. Temos abarcado aí muitas techs modernas. Estão às vezes você estuda uma ferramenta, ano que vem já é outra. Mas quando falamos de conceitos, de tomada de decisão, de planejamento, isso é perene, é contemporâneo, não passa. Então, estudar Data Warehouse no sentido de pensar no negócio e como eu trabalho os meus KPIs para tomada de decisão, é algo que te empodera para a carreira, e vale super a pena você continuar investindo nesse assunto.