WEBVTT 00:00:07.860 --> 00:00:10.682 Nos primórdios do Business Intelligence, 00:00:10.682 --> 00:00:15.597 levávamos pelo menos aí um ano dentro da construção de um Data Warehouse 00:00:15.597 --> 00:00:17.798 para fazer, de fato, uma entrega de valor. 00:00:18.685 --> 00:00:22.455 Ao longo desse tempo, muitos projetos naufragavam. 00:00:22.455 --> 00:00:27.342 Período longo demais para manter o patrocínio da alta gestão. 00:00:28.495 --> 00:00:31.135 Boas notícias! Nós viramos esse jogo. 00:00:31.135 --> 00:00:35.989 Com uma stack moderna de dados, trazendo agilidade na gestão dos projetos, 00:00:35.989 --> 00:00:39.454 usando ferramentas low cost, indo para cloud, 00:00:39.454 --> 00:00:44.018 trabalhando muito mais DataOps, hoje, em pouquíssimo tempo, 00:00:44.018 --> 00:00:49.449 nós conseguimos entregar na mão dos analistas, dos times de gestão, 00:00:49.449 --> 00:00:52.455 informações consistentes para a tomada de decisão. 00:00:52.455 --> 00:00:56.258 Eu sou Tassiana, sou gestora de dados e analytics na triggo.ai, 00:00:56.258 --> 00:00:58.358 que é uma startup de Inteligência Artificial, 00:00:58.358 --> 00:01:02.262 professora e coordenadora de MBA aqui na FIAP. 00:01:02.262 --> 00:01:05.249 E eu estou aqui com nosso querido Lucas Brandi, 00:01:05.249 --> 00:01:08.007 sumidade quando o assunto é dados. 00:01:08.007 --> 00:01:11.137 Ele vai contar um pouquinho da carreira dele para nós, 00:01:11.137 --> 00:01:15.012 contar como os dados fazem parte hoje 00:01:15.012 --> 00:01:17.692 do seu cotidiano né, Lucas? 00:01:17.692 --> 00:01:21.781 E nós vamos bater um papo aqui bem gostoso sobre boas práticas, 00:01:21.781 --> 00:01:25.051 justamente nesse contexto das informações. 00:01:25.051 --> 00:01:25.822 Exatamente. 00:01:26.386 --> 00:01:29.589 Bom, meu nome é Lucas Brandi, eu sou engenheiro de dados. 00:01:29.589 --> 00:01:34.048 Trabalho para uma empresa chamada X-Team como consultor para projetos internacionais, 00:01:34.048 --> 00:01:38.498 principalmente no âmbito de Data Warehouse e Data Lake. 00:01:38.498 --> 00:01:43.431 Ambos os projetos são voltados para organizarmos os dados 00:01:43.431 --> 00:01:47.659 de uma forma eficiente para o uso posterior, para ciência de dados, 00:01:47.659 --> 00:01:51.177 para análises, desenvolvimento de métricas e assim por diante. 00:01:51.177 --> 00:01:54.247 Em poucas palavras, trazer valor para o negócio. 00:01:54.247 --> 00:01:55.012 Muito bacana. 00:01:55.012 --> 00:01:56.529 Gente, o Lucas é um engenheiro incrível. 00:01:56.529 --> 00:01:59.786 Vai dar dicas importantíssimas para vocês. 00:01:59.786 --> 00:02:02.199 E para partirmos do início, Lucas, 00:02:02.199 --> 00:02:06.311 sempre tem ali uma necessidade de tomada de decisão, 00:02:06.311 --> 00:02:08.061 uma necessidade de análise. 00:02:08.061 --> 00:02:09.829 Toda organização tem. 00:02:09.829 --> 00:02:13.599 Mas daí até chegar a implementação de um projeto, 00:02:13.599 --> 00:02:17.668 uma esteira de construção de engenharia, uma entrega de valor lá na ponta, 00:02:17.668 --> 00:02:22.208 com dashboards, com estatísticas, 00:02:22.208 --> 00:02:25.711 e às vezes até evoluir para um Machine Learning, enfim, 00:02:25.711 --> 00:02:29.315 como funciona esse trilho, como nascem esses projetos, 00:02:29.315 --> 00:02:32.656 e como vamos fazendo toda essa construção? 00:02:33.428 --> 00:02:36.389 Eu acho que nós temos diversas situações. 00:02:36.389 --> 00:02:39.028 Em alguns casos, quando começamos um projeto de dados, 00:02:39.028 --> 00:02:42.128 pode ser que seja numa empresa que também está começando. 00:02:42.128 --> 00:02:45.598 Então avançamos com a maturidade de dados, 00:02:45.598 --> 00:02:49.068 assim como a empresa está avançando também com o desenvolvimento do produto. 00:02:49.068 --> 00:02:53.739 Em outros cenários, já temos um produto desenvolvido, uma empresa estabelecida, 00:02:53.739 --> 00:02:57.662 mas que ainda não estava utilizando das boas práticas do mercado 00:02:57.662 --> 00:02:59.245 para uso de dados, 00:02:59.245 --> 00:03:02.582 para se tornar uma empresa data-driven, enfim. 00:03:02.582 --> 00:03:07.286 Nesses cenários, nós precisamos estar muito mais próximos 00:03:07.286 --> 00:03:10.605 das áreas de negócio, de quem conhece, domina de fato o produto, 00:03:10.605 --> 00:03:13.993 para conseguir extrair esses insumos do negócio, 00:03:13.993 --> 00:03:19.714 para conseguir pensar, planejar como vamos implementar esse projeto de Data Warehouse, 00:03:19.714 --> 00:03:23.278 numa boa plataforma de dados para agregar valor rápido, 00:03:23.278 --> 00:03:25.438 como você mesma disse, para o negócio, 00:03:25.438 --> 00:03:27.622 utilizando diversas outras ferramentas. 00:03:27.622 --> 00:03:30.695 E dependendo do tipo de produto que estamos trabalhando, 00:03:30.695 --> 00:03:34.714 as origens dos nossos dados, temos que pensar também, 00:03:34.714 --> 00:03:37.049 quais ferramentas vamos utilizar ali. 00:03:37.049 --> 00:03:41.723 Então, esse passo inicial, entendermos se o produto já existe, 00:03:41.723 --> 00:03:45.489 se a empresa já trabalha com algum tipo de métrica, 00:03:45.489 --> 00:03:48.517 quais são essas métricas, como elas são calculadas 00:03:48.517 --> 00:03:51.297 é a base de tudo, né, é onde começamos. 00:03:51.297 --> 00:03:56.202 E caso seja uma empresa nova, que já está nascendo na nuvem mesmo, 00:03:56.202 --> 00:04:01.912 que já temos essa ideia de trabalhar com analytics desde o início, 00:04:01.912 --> 00:04:03.576 às vezes é um pouquinho mais fácil, 00:04:03.576 --> 00:04:07.480 porque aí conseguimos trabalhar em conjunto com o desenvolvimento do produto, 00:04:07.480 --> 00:04:10.015 já trazendo essas métricas e acompanhando as métricas 00:04:10.015 --> 00:04:12.573 enquanto o produto está sendo desenvolvido. 00:04:12.573 --> 00:04:16.155 Então, é um crescimento meio que paralelo das duas frentes, 00:04:16.155 --> 00:04:19.605 não só o negócio, como também a plataforma que estamos desenvolvendo. 00:04:19.605 --> 00:04:20.452 Perfeito. 00:04:20.452 --> 00:04:24.331 Quando falamos do mercado, o cenário é complexo, né, 00:04:24.331 --> 00:04:28.968 então você tem ali uma estratégia de negócio a ser pensada, 00:04:28.968 --> 00:04:31.504 depois tem um olhar arquitetural também. 00:04:31.504 --> 00:04:36.216 As arquiteturas são híbridas, às vezes uma colcha de retalhos. 00:04:36.216 --> 00:04:37.910 É sempre muito, né... 00:04:37.910 --> 00:04:40.235 O Lucas está bastante adaptado a essa realidade. 00:04:40.235 --> 00:04:42.715 É sempre muito consultivo, né? 00:04:42.715 --> 00:04:45.017 Não existe uma receita de bolo. 00:04:45.017 --> 00:04:48.254 Trabalhamos os conceitos com os alunos, mas no mercado, 00:04:48.254 --> 00:04:52.091 essa adaptabilidade e flexibilidade são superimportantes, 00:04:52.091 --> 00:04:57.096 essa leitura ali do contexto e da necessidade do cliente. 00:04:57.096 --> 00:05:01.433 Por falar em necessidade do cliente, Lucas, falamos muito de visão 360. 00:05:01.433 --> 00:05:03.147 Isso é um termo meio negócio, né? 00:05:03.147 --> 00:05:06.338 Eu quero uma visão 360 ali do meu cliente. 00:05:06.338 --> 00:05:09.545 Você acha que um projeto nessa linha que nós estamos comentando, 00:05:09.545 --> 00:05:11.831 de um Data Warehouse, de uma base analítica, 00:05:11.831 --> 00:05:15.157 contribui para chegarmos nessa visão? 00:05:15.157 --> 00:05:16.115 Com certeza. 00:05:16.115 --> 00:05:21.127 Pensando numa estratégia para entendermos como a empresa está funcionando, 00:05:21.127 --> 00:05:25.758 essa visão 360 acaba sendo... O que nós temos ao nosso redor? 00:05:25.758 --> 00:05:30.929 Conseguíamos enxergar desde as origens dos nossos dados 00:05:30.929 --> 00:05:34.648 como estamos definindo o nosso produto, como esse produto está sendo consumido, 00:05:34.648 --> 00:05:38.931 como diferentes áreas estão trabalhando com o desenvolvimento desse produto, 00:05:38.931 --> 00:05:41.640 e, consequentemente, falando de dados, 00:05:41.640 --> 00:05:46.481 como todos esses insumos estão sendo utilizados internamente. 00:05:46.481 --> 00:05:50.540 Então, a base dessa visão 360 é construir uma plataforma 00:05:50.540 --> 00:05:54.171 onde consigamos servir os nossos usuários internos com dados 00:05:54.171 --> 00:05:57.461 para que eles possam responder as próprias perguntas 00:05:57.461 --> 00:06:00.647 e entender, ter essa visão ampla, 00:06:00.647 --> 00:06:02.327 de tudo o que está acontecendo na empresa. 00:06:02.327 --> 00:06:05.331 Em alguns casos, essa visão ampla, 00:06:05.331 --> 00:06:09.001 dentro de grandes empresas e grandes projetos, 00:06:09.001 --> 00:06:12.271 acaba sendo muito difícil centralizarmos num único grupo de pessoas. 00:06:12.271 --> 00:06:16.275 Então descentralizamos até um pouco mais essa estrutura 00:06:16.275 --> 00:06:19.853 para conseguirmos controlar escopos de negócio. 00:06:19.853 --> 00:06:22.881 Ao invés de termos silos muito fechados, 00:06:22.881 --> 00:06:26.468 termos essas estruturas individuais 00:06:26.468 --> 00:06:29.188 funcionando em paralelo dentro de uma empresa, 00:06:29.188 --> 00:06:30.838 que é muito o conceito de data mash, né, 00:06:30.838 --> 00:06:35.709 onde conseguimos que pequenas áreas, ou pequenos grupos de pessoas, 00:06:35.709 --> 00:06:39.410 consigam ali controlar toda essa visão 360 00:06:39.410 --> 00:06:41.650 de um escopo de trabalho específico, 00:06:41.650 --> 00:06:44.368 por exemplo, só de finanças, só de marketing, 00:06:44.368 --> 00:06:47.139 de aquisição de novos usuários, e assim por diante. 00:06:47.139 --> 00:06:48.952 Aí, tudo isso funcionando em paralelo, 00:06:48.952 --> 00:06:51.652 quando precisarmos ter essa visão da empresa como um todo, 00:06:51.652 --> 00:06:53.817 vamos extraindo os dados de cada ponta 00:06:53.817 --> 00:06:57.718 para conseguir entender o funcionamento da plataforma como um todo. 00:06:57.718 --> 00:06:58.575 Sensacional. 00:06:58.575 --> 00:07:03.855 A ideia da malha de dados, que é algo super-recente e moderno, 00:07:03.855 --> 00:07:07.759 apoia muito essa completude de informações. 00:07:07.759 --> 00:07:08.846 Sensacional! 00:07:08.846 --> 00:07:13.997 E eu comecei, Lucas, falando um pouco do patrocinador, do sponsor, né, 00:07:13.997 --> 00:07:16.336 que o PMBOK fala muito também. 00:07:16.336 --> 00:07:18.837 Sabemos que na gestão de um projeto, 00:07:18.837 --> 00:07:23.146 e você já viveu vários contextos assim, 00:07:23.146 --> 00:07:26.913 um patrocínio é superimportante, né? 00:07:26.913 --> 00:07:29.864 Quando falamos de um projeto de estruturação dos dados, 00:07:29.864 --> 00:07:32.828 assim como um projeto de governança, 00:07:32.828 --> 00:07:36.206 às vezes demoramos um pouquinho para entregar valor. 00:07:36.206 --> 00:07:39.432 É muito mais fácil entregar valor num dashboard, né? 00:07:39.432 --> 00:07:40.564 Concorda comigo? 00:07:40.564 --> 00:07:41.827 É palpável, né? 00:07:41.827 --> 00:07:45.132 Todo mundo acessa aquele relatório, ele responde as perguntas. 00:07:45.132 --> 00:07:47.566 Mas e essa esteira de engenharia que vem antes, 00:07:47.566 --> 00:07:49.067 tempo do tratamento dos dados? 00:07:49.067 --> 00:07:52.070 Isso toma um pouquinho de tempo, mesmo que sejamos ágeis, 00:07:52.070 --> 00:07:54.573 e vai gerando uma certa ansiedade na organização. 00:07:54.573 --> 00:08:00.052 Então, mesmo com a agilidade, ainda é um projeto que precisa de patrocínio, né, 00:08:00.052 --> 00:08:02.830 patrocínio forte ali. 00:08:02.830 --> 00:08:03.548 Sem dúvida. 00:08:03.548 --> 00:08:07.319 Falando de dados, quem é o patrocinador? 00:08:07.319 --> 00:08:08.353 Quais são as áreas? 00:08:08.353 --> 00:08:10.388 Quem costuma ser esse sponsor? 00:08:10.388 --> 00:08:13.262 Esse projeto costuma partir de quem? 00:08:13.262 --> 00:08:14.726 Como isso tem funcionado? 00:08:14.726 --> 00:08:17.781 Existe um padrão ou varia de uma empresa para outra? 00:08:17.781 --> 00:08:21.335 É interessante pensarmos em quem é o sponpor, né, 00:08:21.335 --> 00:08:23.955 porque principalmente em algumas empresas pequenas, 00:08:23.955 --> 00:08:27.480 um dos projetos que eu atuo agora é de uma empresa um pouco menor, 00:08:27.480 --> 00:08:33.411 onde o sponsor do projeto acaba sendo, de fato, o CEO, o dono da empresa, 00:08:33.411 --> 00:08:37.390 quem está precisando, de fato, de insumos para a tomada de decisão. 00:08:37.390 --> 00:08:40.285 Então acaba sendo algo um pouco mais direcionado. 00:08:40.285 --> 00:08:44.623 Mas quando pensamos em empresas maiores, 00:08:44.623 --> 00:08:49.138 um patrocinador do projeto normalmente seria aquela empresa, aquele grupo de... 00:08:50.468 --> 00:08:53.708 Aquela área ou aquele grupo de pessoas, 00:08:53.708 --> 00:08:58.036 que precisam tomar uma decisão, responder algum tipo de pergunta, 00:08:58.036 --> 00:09:01.172 e não necessariamente tem todos esses assuntos prontos, 00:09:01.172 --> 00:09:06.645 seja origem de dados onde não temos mapeado dentro da nossa plataforma, 00:09:06.645 --> 00:09:09.545 seja processos de transformação que não foram implementados 00:09:09.545 --> 00:09:13.069 para calcular determinadas métricas, indicadores, 00:09:13.069 --> 00:09:14.919 ou até mesmo desenvolvimento de dashboards. 00:09:14.919 --> 00:09:19.758 Então, todo esse processo, essa esteira inteira, desde a extração dos dados, 00:09:19.758 --> 00:09:22.738 a manipulação desses dados, o desenvolvimento das métricas, 00:09:22.738 --> 00:09:26.142 e, por fim, o consumo para tomada de decisão, 00:09:26.142 --> 00:09:29.883 tudo isso parte da necessidade de alguém, ou de algum grupo de pessoas, 00:09:29.883 --> 00:09:32.103 ou de alguma área. 00:09:32.103 --> 00:09:35.564 Então, normalmente essa área que vai patrocinar, que vai investir ali, 00:09:35.564 --> 00:09:38.673 não só o recurso financeiro, mas também tempo, né, 00:09:38.673 --> 00:09:42.461 para fazermos toda a organização do projeto, para disponibilização... 00:09:43.801 --> 00:09:47.318 E implementação desse projeto completo de dados. 00:09:47.318 --> 00:09:49.825 Normalmente vemos esse tipo de cenário. 00:09:49.825 --> 00:09:54.335 E faz sentido dizer que, na maioria das vezes, é uma dor de negócio. 00:09:54.335 --> 00:09:58.348 E quando não se conecta o negócio que está sendo desenvolvido, 00:09:58.348 --> 00:10:00.832 temos até dificuldade de vender internamente. 00:10:00.832 --> 00:10:05.170 Então eu observo muitos projetos de novo naufragando, 00:10:05.170 --> 00:10:07.880 porque tem toda um aparato tecnológico, 00:10:07.880 --> 00:10:11.743 mas os times de negócio ainda não conseguiram enxergar valor, não utilizam. 00:10:11.743 --> 00:10:14.746 E se não se conecta com valor para a organização, 00:10:14.746 --> 00:10:17.949 aquilo perde, perde em si. 00:10:17.949 --> 00:10:22.515 Então esse processo de empurrar a tecnologia é muito mais desafiador, né, 00:10:22.515 --> 00:10:27.618 diferente de quando o negócio está puxando ali e consegue entregar muito valor. 00:10:28.433 --> 00:10:30.628 Como é essa sinergia? 00:10:30.628 --> 00:10:34.643 Eu me lembro, nesse mercado, 00:10:34.643 --> 00:10:37.936 de ter um preciosismo técnico muito grande. 00:10:37.936 --> 00:10:42.774 Quando você ia contratar, tinha que ser aquele profissional que dominava o código, 00:10:42.774 --> 00:10:45.983 aquela tela ali do "shell", aquela tela preta e tudo mais. 00:10:45.983 --> 00:10:50.216 E eu tenho percebido o mercado mudando, né? 00:10:50.216 --> 00:10:53.166 Mesmo hoje, quando eu estou contratando um dev. 00:10:53.166 --> 00:10:55.492 um profissional que vai atuar mais tecnicamente, 00:10:55.492 --> 00:10:58.892 ele precisa ter esse feeling de negócio, 00:10:58.892 --> 00:11:02.393 essa conexão com o propósito que ele está fazendo. 00:11:02.393 --> 00:11:06.864 Você enxerga assim também, esse alinhamento, negócio técnico... 00:11:06.864 --> 00:11:10.572 Porque até parece que, na malha de dados, conseguimos fazer melhor. 00:11:10.572 --> 00:11:11.469 Com certeza. 00:11:11.469 --> 00:11:12.942 Esse alinhamento é muito interessante, 00:11:12.942 --> 00:11:15.498 principalmente quando pensamos na stack moderna de dados, 00:11:15.498 --> 00:11:20.111 que é um conceito, um framework que surgiu recentemente, 00:11:20.111 --> 00:11:26.395 tentando trazer algumas boas práticas, algumas situações que visam justamente 00:11:26.395 --> 00:11:29.439 permitir que profissionais não tão técnicos, 00:11:29.439 --> 00:11:31.189 não necessariamente só engenheiros de dados, 00:11:31.189 --> 00:11:35.927 possam trabalhar com desenvolvimento, contribuir com uma plataforma de dados. 00:11:35.927 --> 00:11:39.797 Então utilizamos ferramentas como low-code ou no-code, por exemplo, 00:11:39.797 --> 00:11:42.800 ferramentas visuais para conseguirmos fazer a integração de dados, 00:11:42.800 --> 00:11:45.032 ferramentas visuais para conseguirmos também 00:11:45.032 --> 00:11:48.858 criar projetos de transformação de dados, quando cabe... 00:11:50.633 --> 00:11:52.310 Ferramentas de visualização. 00:11:52.310 --> 00:11:58.034 Quase todas são drag-and-drop, onde vamos construindo ali a nossa visualização 00:11:58.034 --> 00:11:59.750 sem precisar necessariamente de código. 00:11:59.750 --> 00:12:04.856 Então, esse tipo de recurso permite com que outros profissionais, 00:12:04.856 --> 00:12:10.261 normalmente de negócios, também consigam participar mais dentro de uma plataforma, 00:12:10.261 --> 00:12:14.655 Então nós estamos mudando um pouco aquele paradigma de que dados, 00:12:14.655 --> 00:12:17.168 uma área de dados, seria uma área de TI. 00:12:17.168 --> 00:12:18.069 Não necessariamente. 00:12:18.069 --> 00:12:19.804 Eu penso em dados como uma área híbrida, 00:12:19.804 --> 00:12:23.574 uma área onde temos uma sinergia muito grande com negócios, 00:12:23.574 --> 00:12:27.612 onde precisamos entender o que está sendo realizado do lado de negócios, 00:12:27.612 --> 00:12:29.814 do lado do nosso produto, e assim por diante, 00:12:29.814 --> 00:12:32.950 e também que possa navegar no ferramental que temos disponível 00:12:32.950 --> 00:12:34.986 dentro de uma plataforma de dados. 00:12:34.986 --> 00:12:39.790 Então, esse cenário onde conseguimos utilizar ferramentas 00:12:39.790 --> 00:12:45.122 para resolver problemas de negócio, essa ponte acaba sendo o cenário ideal 00:12:45.122 --> 00:12:49.806 onde conseguimos escalar projetos de dados, de Data Warehouse, 00:12:49.806 --> 00:12:52.477 de BI, visualização, e assim por diante. 00:12:52.477 --> 00:12:55.752 A ferramenta é sempre um meio, né, TI é um meio. 00:12:55.752 --> 00:12:57.742 Nunca um fim em si, né? 00:12:57.742 --> 00:13:02.613 Até por isso vemos projetos muitas vezes começando com estabelecimento de domínio. 00:13:02.613 --> 00:13:04.416 Domínio é um assunto de negócio, né? 00:13:04.416 --> 00:13:08.619 Qual é o meu domínio financeiro, o meu domínio de pessoas. 00:13:08.619 --> 00:13:12.490 Hoje temos falado muito em governança, na identificação do owner, 00:13:12.490 --> 00:13:13.867 quem é o dono do dado. 00:13:13.867 --> 00:13:18.062 E geralmente esse dono do dado é alguém de negócio, 00:13:18.062 --> 00:13:21.398 que entende bem da transação, mas também do analítico, 00:13:21.398 --> 00:13:24.301 porque até então tínhamos uma barreira muito grande. 00:13:24.301 --> 00:13:25.870 Parece que o mundo transacional... 00:13:25.870 --> 00:13:28.472 Do transacional para o analítico, trocávamos de assunto. 00:13:28.472 --> 00:13:31.450 E não é. É uma nova forma de organizar o dado, 00:13:31.450 --> 00:13:33.310 mas é o mesmo dado, é o mesmo assunto, 00:13:33.310 --> 00:13:37.248 é o mesmo domínio de negócio, e dores muito parecidas, né? 00:13:37.248 --> 00:13:40.417 Então, no mesh, nós temos conseguido uma malha de dados, 00:13:40.417 --> 00:13:46.576 temos conseguido essas evoluções que trazem mais o negócio para o jogo. 00:13:46.576 --> 00:13:50.394 Eu tenho observado isso, ferramentas mais colaborativas também, 00:13:50.394 --> 00:13:54.265 que o time de negócio consegue entender o que está acontecendo e colaborar. 00:13:54.265 --> 00:13:58.006 E aí são projetos que você gasta mais tempo discutindo o negócio 00:13:58.006 --> 00:14:01.315 do que aplicando ali a complexidade técnica. 00:14:01.315 --> 00:14:02.541 Que, no final das contas, é o que importa, né? 00:14:02.541 --> 00:14:03.541 Que é o que importa. Exatamente. 00:14:03.541 --> 00:14:05.776 Estão, assim, são tendências importantes. 00:14:05.776 --> 00:14:09.748 Não importa se você é de negócio ou se é uma pessoa mais técnica, 00:14:09.748 --> 00:14:11.785 isso precisa estar no nosso radar. 00:14:11.785 --> 00:14:14.095 Mas eu acho importante ressaltar também que não necessariamente 00:14:14.095 --> 00:14:16.274 o que estamos mencionando de ferramentas low-code, 00:14:16.274 --> 00:14:19.445 ou visuais, né, e assim por diante, que não temos código, 00:14:19.445 --> 00:14:23.761 que não estamos falando de Python, Scala, Java, enfim, 00:14:23.761 --> 00:14:27.617 essa parte mais técnica mesmo da área de dados. 00:14:27.617 --> 00:14:29.300 Nós temos isso também. 00:14:29.300 --> 00:14:30.530 Só que, em alguns cenários, 00:14:30.530 --> 00:14:35.145 nós não precisamos de muita complexidade para resolver problemas. 00:14:35.145 --> 00:14:40.005 Não precisamos utilizar as ferramentas que estão super em alta no mercado 00:14:40.005 --> 00:14:42.084 só porque estão em alta no mercado. 00:14:42.084 --> 00:14:43.113 Não necessariamente. 00:14:43.113 --> 00:14:47.651 Podemos utilizar outras alternativas que já vão resolver os nossos problemas 00:14:47.651 --> 00:14:51.764 de determinada área da empresa, ou às vezes até mesmo da empresa inteira, 00:14:51.764 --> 00:14:54.153 com uma simplicidade maior, facilidade maior, 00:14:54.153 --> 00:14:56.427 sem a necessidade de um grande time de dados, 00:14:56.427 --> 00:14:59.466 garantindo que outras pessoas estejam contribuindo ali também, 00:14:59.466 --> 00:15:01.334 colaborando com o projeto. 00:15:01.334 --> 00:15:06.670 Então é aquela questão, né, precisamos identificar o cenário, 00:15:06.670 --> 00:15:09.440 os requisitos que nós temos, onde queremos chegar, 00:15:09.440 --> 00:15:11.694 para conseguir ter essa escolha também do ferramental. 00:15:11.694 --> 00:15:12.655 Mas... 00:15:15.268 --> 00:15:19.301 Frisando essa escolha de ferramentas, 00:15:19.301 --> 00:15:25.212 não descartamos ferramentas mais complexas, mais técnicas de fato, com código, 00:15:25.212 --> 00:15:27.734 para resolução de problemas mais complexos também. 00:15:27.734 --> 00:15:29.611 Então elas caminham em paralelo. 00:15:29.611 --> 00:15:33.409 Para cada situação, vamos ter ali um ferramental mais específico 00:15:33.409 --> 00:15:35.244 resolvendo um problema de uma forma diferente. 00:15:35.244 --> 00:15:36.784 Bom ponto, bom ponto. 00:15:36.784 --> 00:15:39.418 Porque nós estamos falando de um mundo de BI, de um Data Waresouse, 00:15:39.418 --> 00:15:42.339 de KPIs para tomada de decisão, 00:15:42.339 --> 00:15:45.919 mas, de repente, eu preciso de uma latência mais baixinha, 00:15:45.919 --> 00:15:48.349 o dado não entrar tão estruturado. 00:15:48.349 --> 00:15:53.617 A minha dor de negócio está relacionada a uma fonte que é um log, 00:15:53.617 --> 00:15:57.187 que é algo que exige, de repente, um monitoramento, 00:15:57.187 --> 00:15:59.556 e aí eu vou para o mundo de Big Data. 00:15:59.556 --> 00:16:01.792 Talvez eu não esteja falando só do DW, 00:16:01.792 --> 00:16:05.796 talvez seja um data lake, que é um outro repositório analítico, 00:16:05.796 --> 00:16:09.700 um Data Lakehouse, que é alguma coisa um pouco mais moderna. 00:16:09.700 --> 00:16:14.177 De repente eu quero fazer uma implementação mais open source 00:16:14.177 --> 00:16:17.774 por uma necessidade específica ali do meu contexto. 00:16:17.774 --> 00:16:22.631 As ferramentas open source, muitas delas de Big Datas mais robustas, 00:16:22.631 --> 00:16:26.634 vêm com uma necessidade de código maior, né? 00:16:26.634 --> 00:16:31.288 Então tem casos em que a implementação vai ser um pouco mais complexa. 00:16:31.288 --> 00:16:35.125 Geralmente projetos mais robustos, um maior volume de dados, 00:16:35.125 --> 00:16:39.663 uma complexidade técnica maior, uma latência menor. 00:16:39.663 --> 00:16:42.132 Ainda cabe essa questão, né, 00:16:42.132 --> 00:16:44.534 cabe bastante ainda a questão do desenvolvimento. 00:16:44.534 --> 00:16:46.303 Eu acho que o importante é não ter preconceito. 00:16:46.303 --> 00:16:47.871 Eu brinco muito com os alunos: 00:16:47.871 --> 00:16:50.418 você vai de raiz ou vai de Nutella? 00:16:50.418 --> 00:16:52.988 O raiz é o código lá e tudo mais, 00:16:52.988 --> 00:16:58.069 e o Nutella é o low-code, o drag-and-drop, a a questão visual, né? 00:16:58.069 --> 00:16:59.683 E existe preconceito. 00:16:59.683 --> 00:17:03.036 Eu já ouvi de gestores em reuniões mesmo, 00:17:03.036 --> 00:17:06.189 que eu estou ali, apresentando uma proposta, 00:17:06.189 --> 00:17:09.559 e eu percebo que eu falei alguma coisa de low-code e ele torceu o nariz... 00:17:09.559 --> 00:17:11.106 "Aqui todo mundo coda. 00:17:11.106 --> 00:17:12.607 Temos codar. 00:17:12.607 --> 00:17:14.097 Hand coding...". 00:17:14.097 --> 00:17:16.036 Mas aí é um preconceito, né, 00:17:16.036 --> 00:17:17.767 porque, de repente, como você falou, 00:17:17.767 --> 00:17:21.771 em alguns casos você traz alguma coisa mais low-code, resolve, 00:17:21.771 --> 00:17:24.115 você entrega o projeto muito mais rápido. 00:17:24.115 --> 00:17:25.175 Uma questão de custo. 00:17:25.175 --> 00:17:30.313 Então, quem está gerindo o projeto precisa ter esse olhar mais agnóstico 00:17:30.313 --> 00:17:33.208 de pensar qual é a melhor ferramenta, a melhor estratégia, 00:17:33.208 --> 00:17:35.949 para aquele cenário específico. 00:17:35.949 --> 00:17:37.301 É isso, né? 00:17:37.301 --> 00:17:39.374 Muito desse preconceito vem do uso indevido 00:17:39.374 --> 00:17:41.892 de algumas ferramentas justamente nesse cenário... 00:17:41.892 --> 00:17:45.911 "Ah, esse projeto aqui precisava de uma complexidade um pouco maior", 00:17:45.911 --> 00:17:49.216 porque a demanda de negócio chegava.... 00:17:50.098 --> 00:17:55.305 A necessidade de negócio precisava de uma latência mais baixa, ?, dependendo 00:17:55.305 --> 00:17:59.219 ou até mesmo a quantidade de pessoas trabalhando juntas no mesmo pipeline. 00:17:59.219 --> 00:18:02.712 Com algumas ferramentas visuais, temos algumas limitações desse tipo. 00:18:02.712 --> 00:18:04.820 Às vezes não tem versionamento de código. 00:18:04.820 --> 00:18:07.150 Tem alguns problemas nessas ferramentas. 00:18:07.150 --> 00:18:08.018 Elas não são perfeitas. 00:18:08.018 --> 00:18:10.887 Elas são mais fáceis para começarmos a trabalhar, 00:18:10.887 --> 00:18:14.227 mas não necessariamente resolvem todos os problemas. 00:18:14.227 --> 00:18:17.167 Só que aí tentamos utilizar essas ferramentas 00:18:17.167 --> 00:18:20.239 conforme o projeto vai ganhando algum tipo de complexidade, 00:18:20.239 --> 00:18:22.987 que outras soluções fariam mais sentido. 00:18:22.987 --> 00:18:24.801 Daí que acaba entrando um pouco desse preconceito, 00:18:24.801 --> 00:18:28.277 porque vemos muito esse tipo de infraestrutura com um projeto legado 00:18:28.277 --> 00:18:33.053 utilizando dessas ferramentas, e que já enxergamos hoje que não são mais escaláveis. 00:18:33.053 --> 00:18:36.379 Então quer dizer que eu não vou mais utilizar esse tipo de ferramenta? 00:18:36.379 --> 00:18:39.181 Não, tem casos e casos. 00:18:39.181 --> 00:18:43.104 Só precisamos escolher corretamente e entender a hora de mudar, 00:18:43.104 --> 00:18:44.130 caso seja necessário. 00:18:44.130 --> 00:18:45.067 Na hora de escalar, exato. 00:18:45.067 --> 00:18:47.097 E o contrário também é válido, né? 00:18:47.097 --> 00:18:51.428 Vemos aí a onda do Kafka, que é uma superferramenta de mensageria. 00:18:51.428 --> 00:18:54.664 Quem gosta da coisa técnica, adora. 00:18:54.664 --> 00:18:58.568 Ela é parruda, está na arquitetura de grandes players, né, 00:18:58.568 --> 00:19:01.604 LinkedIn, Uber e por aí vai. 00:19:01.604 --> 00:19:04.980 Então o entusiasta técnico que pôr Kafka em tudo, né? 00:19:04.980 --> 00:19:08.186 Isso vale no contexto corporativo, nas aulas também... 00:19:08.186 --> 00:19:09.379 "Vamos desenhar uma arquitetura?". 00:19:09.379 --> 00:19:12.416 Eu trago uma dor de negócio, eu especifico ali o volume, 00:19:12.416 --> 00:19:14.096 o aluno vem com Kafka na arquitetura. 00:19:14.096 --> 00:19:16.776 Mas às vezes é uma dor que o Excel resolveria, né? 00:19:16.776 --> 00:19:17.650 E nada contra o Excel. 00:19:17.650 --> 00:19:19.830 Se resolve, está ótimo. 00:19:19.830 --> 00:19:22.692 Então eu acho que são os dois lados. 00:19:22.692 --> 00:19:27.300 Existe o time do hand-code e o time do low-code. 00:19:27.300 --> 00:19:32.310 Na verdade, a visão arquitetural, a visão estratégica, 00:19:32.310 --> 00:19:35.030 madura, é superimportante, 00:19:35.030 --> 00:19:36.370 Com certeza. 00:19:36.370 --> 00:19:42.378 O nosso aluno precisa ir ganhando essa maturidade para a tomada de decisão. 00:19:42.378 --> 00:19:43.046 Muito bacana! 00:19:43.046 --> 00:19:46.884 E falando, Lucas... Bom esse papo, né, profundo. 00:19:46.884 --> 00:19:53.156 Falando aí para o nosso aluno mesmo, que está vivenciando esse mundo dos dados, 00:19:53.156 --> 00:19:55.619 alguns já estão ali atuando, 00:19:55.619 --> 00:20:01.529 você enxerga papéis claros na construção de uma solução analítica? 00:20:01.529 --> 00:20:07.770 O que eu posso ser, pensando no que eu posso estudar e tudo mais? 00:20:07.770 --> 00:20:13.609 Você, como engenheiro, interage ali com outros profissionais. 00:20:13.609 --> 00:20:15.724 Quais são esses papéis? 00:20:15.724 --> 00:20:20.249 Nós temos aquela divisão básica de uma plataforma de dados. 00:20:20.249 --> 00:20:22.397 Temos um time de engenharia de dados, 00:20:22.397 --> 00:20:25.621 time de ciência de dados e de análise de dados. 00:20:25.621 --> 00:20:27.960 Essa é a divisão tradicional, 00:20:27.960 --> 00:20:32.300 mas temos muito mais carreiras dentro de dados, 00:20:32.300 --> 00:20:33.783 principalmente quando escalamos, 00:20:33.783 --> 00:20:37.734 quando pensamos em grandes empresas, grandes projetos. 00:20:37.734 --> 00:20:41.550 Temos que levar muito em consideração segurança de dados, 00:20:41.550 --> 00:20:43.341 temos que levar em consideração governança. 00:20:45.241 --> 00:20:49.739 Dependendo, um engenheiro de dados, pode estar muito mais próximo, 00:20:49.739 --> 00:20:54.951 por exemplo, do Kafka, de ferramentas mais técnicas, mais tela preta, 00:20:54.951 --> 00:20:59.589 e outros engenheiros de dados estão mais próximos de transformação, especificamente, 00:20:59.589 --> 00:21:03.574 têm mais facilidade de lidar com o negócio, de extrair aqueles insumos de negócio 00:21:03.574 --> 00:21:06.696 para conseguir implementar um pipeline de transformação. 00:21:06.696 --> 00:21:09.832 E não conseguimos classificar tudo numa mesma caixinha. 00:21:09.832 --> 00:21:12.076 O engenheiro de dados, ou a engenheira de dados... 00:21:14.036 --> 00:21:19.108 Vai conseguir fazer tudo, né, realizar todos essas atividades, 00:21:19.108 --> 00:21:21.210 dominar todas essas possíveis ferramentas. 00:21:21.210 --> 00:21:25.348 Então está cada vez mais ficando segregado algumas responsabilidades. 00:21:25.348 --> 00:21:29.218 Hoje, a engenharia de dados está muito mais próxima de plataforma, 00:21:29.218 --> 00:21:31.754 onde pensamos em integração de dados, 00:21:31.754 --> 00:21:36.325 onde pensamos em manutenção de ferramentas, como sistemas de mensageria, 00:21:36.325 --> 00:21:40.329 de orquestração de dados, Data Warehouse, data lakes, 00:21:40.329 --> 00:21:42.431 toda essa parte mais de infraestrutura. 00:21:42.431 --> 00:21:47.637 E enquanto no processo de transformação nós estamos usando lyrics engineers 00:21:47.637 --> 00:21:52.375 que é uma carreira razoavelmente nova 00:21:52.375 --> 00:21:57.878 e é especializada em implementar processos de transformação de dados 00:21:57.878 --> 00:22:02.095 utilizando insumos de negócio que foram coletados 00:22:02.095 --> 00:22:05.022 e navegando na plataforma que foi desenvolvida 00:22:05.022 --> 00:22:06.822 pelo time de engenheiros de dados. 00:22:06.822 --> 00:22:08.197 Ele é meio híbrido ali, né? 00:22:08.197 --> 00:22:13.056 De todas as profissões, essa é que acaba sendo mais híbrida mesmo, 00:22:13.056 --> 00:22:16.008 que demanda bastante de conhecimento de negócio 00:22:16.008 --> 00:22:19.532 e também conhecimento das ferramentas utilizadas 00:22:19.532 --> 00:22:22.972 para implementar as soluções necessárias para o negócio. 00:22:22.972 --> 00:22:26.729 E na outra ponta, uma vez que já temos esses processos 00:22:26.729 --> 00:22:28.589 de transformação implementados e tudo mais, 00:22:28.589 --> 00:22:32.501 nós temos times de análise, times de ciência de dados, 00:22:32.501 --> 00:22:35.151 times de governança, qualidade. 00:22:35.151 --> 00:22:38.013 Podemos até mesmo ter outros times de negócio, como marketing, por exemplo, 00:22:38.013 --> 00:22:40.547 trabalhando diretamente com dados 00:22:40.547 --> 00:22:44.637 Dados acaba sendo quase que o coração dentro de marketing também. 00:22:44.637 --> 00:22:47.389 É o principal insumo para conseguirmos investir melhor 00:22:47.389 --> 00:22:50.399 os nossos recursos em campanhas, aquisição de usuários, 00:22:50.399 --> 00:22:53.178 fazer testes A/B, tudo baseado em dados. 00:22:53.178 --> 00:22:58.289 Então são várias possibilidades que nós temos dentro de uma plataforma. 00:22:58.289 --> 00:23:01.060 Em desenvolvimento de projetos de dados, 00:23:01.060 --> 00:23:03.078 as diversas possíveis carreiras, ou em empresas menores, 00:23:03.078 --> 00:23:05.182 acabamos tendo aquele profissional de dados... 00:23:05.182 --> 00:23:08.012 - Que acaba fazendo um pouco de tudo também. - Também, é verdade. 00:23:08.012 --> 00:23:09.896 Ele põe a mão de ponta a ponta. 00:23:09.896 --> 00:23:13.575 E tudo bem, é a realidade da empresa, e para o profissional até é bacana, 00:23:13.575 --> 00:23:17.298 porque às vezes ele aprende mais colocando a mão ali. 00:23:17.298 --> 00:23:21.168 E aí que as ferramentas mais simples, mais visuais, acabam auxiliando também, 00:23:21.168 --> 00:23:24.667 porque mesmo que, por exemplo, a minha especialidade não é visualização, 00:23:24.667 --> 00:23:28.304 mas se eu tenho uma ferramenta que me ajuda de forma gráfica 00:23:28.304 --> 00:23:31.256 a construir um dashboard de forma mais eficiente, ótimo, 00:23:31.256 --> 00:23:35.756 porque eu não preciso aprender uma outra tecnologia do zero e tudo mais. 00:23:35.756 --> 00:23:38.280 Eu já consigo utilizar aquilo para fazer o quê? 00:23:38.280 --> 00:23:41.050 Responder perguntas de negócios, que, no final das contas, é o que importa. 00:23:41.050 --> 00:23:41.826 É o que importa. 00:23:41.826 --> 00:23:44.108 Você tocou num ponto interessante, 00:23:44.108 --> 00:23:49.758 como outras áreas têm vindo para dados e se empoderado. 00:23:49.758 --> 00:23:55.197 Temos trabalhado muito nesse processo de data literacy, alfabetização em dados, 00:23:55.197 --> 00:23:58.667 e vale muito alfabetizar a empresa como um todo, né, 00:23:58.667 --> 00:24:00.576 todos precisam falar dados. 00:24:00.576 --> 00:24:04.173 Então agora é algo que tem crescido 00:24:04.173 --> 00:24:08.577 e que talvez até nos ajude muito mais a alavancar a questão da cultura. 00:24:08.577 --> 00:24:12.134 Como nós podemos, Lucas, fazer essa combinação? 00:24:12.134 --> 00:24:14.316 O que vem primeiro? 00:24:14.316 --> 00:24:17.986 A cultura, a cultura de dados, a cultura data-driven, 00:24:17.986 --> 00:24:21.764 ou colocar lá um Data warehouse? 00:24:21.764 --> 00:24:23.992 Eu percebo que, dependendo do cliente, 00:24:23.992 --> 00:24:28.463 nós começamos o papo pela ponta que está mais fácil, não é? 00:24:28.463 --> 00:24:31.033 Eles querem ter a ferramenta, e, ok, vamos por ali. 00:24:31.033 --> 00:24:34.236 Outros já perceberam que, apesar de ter a ferramenta, 00:24:34.236 --> 00:24:36.138 eles não conseguem garantir um bom uso. 00:24:36.138 --> 00:24:40.109 As pessoas ainda seguem muito no felling, e aí voltam um pouquinho atrás 00:24:40.109 --> 00:24:43.645 e começam a falar de cultura, mindset. 00:24:43.645 --> 00:24:45.562 Você percebe o mercado assim? 00:24:45.562 --> 00:24:47.127 O que deveria... 00:24:47.127 --> 00:24:49.017 Vamos falar do correto. 00:24:49.017 --> 00:24:50.217 O mercado é muito híbrido. 00:24:50.217 --> 00:24:52.195 Mas o que deveria vir primeiro? 00:24:52.195 --> 00:24:55.891 A cultura ou a implementação ali da solução? 00:24:55.891 --> 00:25:00.912 Então, quando temos um tempo limitado para conseguirmos implementar 00:25:00.912 --> 00:25:03.575 um processo de dados uma plataforma de dados, 00:25:03.575 --> 00:25:07.048 normalmente não conseguimos preparar todas as pessoas 00:25:07.048 --> 00:25:09.755 antes de começarmos um projeto desse tipo. 00:25:09.755 --> 00:25:14.544 Aí que entram muitos consultores para conseguir implementar a parte técnica 00:25:14.544 --> 00:25:20.849 utilizando do que a empresa já entende ali 00:25:20.849 --> 00:25:25.520 que vai agregar valor para ela a partir daquele ferramental. 00:25:25.520 --> 00:25:32.027 Mas eu não colocaria a implementação técnica na frente dessa questão cultural. 00:25:32.027 --> 00:25:34.529 Eu acho que tem que caminhar em paralelo. 00:25:34.529 --> 00:25:38.533 Enquanto estamos construindo essa plataforma, 00:25:38.533 --> 00:25:42.504 já temos que demonstrar o porque essa plataforma é relevante, 00:25:42.504 --> 00:25:43.839 como ela é relevante, 00:25:43.839 --> 00:25:46.074 como que vamos utilizar, como vamos agregar valor, 00:25:46.074 --> 00:25:50.846 porque é mais fácil trabalhar com esse tipo de ferramenta, com essa plataforma. 00:25:50.846 --> 00:25:56.018 E tudo isso, em paralelo, acaba garantindo o sucesso do projeto. 00:25:56.018 --> 00:26:01.383 Não adianta gastarmos muito tempo fazendo uma grande preparação, cursos, treinamentos, 00:26:01.383 --> 00:26:03.336 e não estamos vendo a métrica ali. 00:26:03.336 --> 00:26:04.894 - Muita teoria, né... - Exato. 00:26:04.894 --> 00:26:05.894 E nada prático. 00:26:05.894 --> 00:26:09.264 E ao mesmo tempo que... "Nossa, nós já temos aqui toda essa plataforma construída. 00:26:09.264 --> 00:26:11.233 Agora nós vamos desligar aqui todo esse processo que vocês já estavam fazendo 00:26:11.233 --> 00:26:14.106 e vamos utilizar só essa". 00:26:14.106 --> 00:26:17.005 "Por quê? O outro funcionava", alguém pode perguntar. 00:26:17.005 --> 00:26:18.440 E, de fato, estava funcionando. 00:26:18.440 --> 00:26:19.875 Estava da melhor forma? 00:26:19.875 --> 00:26:22.277 Não necessariamente, mas estava funcionando. 00:26:22.277 --> 00:26:27.916 Então, explicar e passar essa sensação de que, beleza, estamos dando agora 00:26:27.916 --> 00:26:31.792 um passo que, de fato, vai ser relevante para nós, é fundamental. 00:26:31.792 --> 00:26:35.727 Porque quando temos um sponsor no projeto, 00:26:35.727 --> 00:26:38.581 pode ser que esse sponsor já tenha comprado a ideia, 00:26:38.581 --> 00:26:43.865 já entenda o valor, de fato, que vamos agregar com essa plataforma desde o início. 00:26:43.865 --> 00:26:46.034 Mas, beleza, temos uma pessoa, 00:26:46.034 --> 00:26:49.171 e todo o restante do time, todo o restante da empresa 00:26:49.171 --> 00:26:55.177 podemos ter mais dificuldade em comprovar isso para eles. 00:26:55.177 --> 00:26:57.879 Então não adianta simplesmente entregarmos esse projeto 00:26:57.879 --> 00:27:02.417 sem pensar na questão cultural que caminha junto ao projeto. 00:27:02.417 --> 00:27:06.245 Sim, e aspectos políticos que são tão desafiadores, né? 00:27:06.245 --> 00:27:11.192 Às vezes o gestor não quer que se fale de uma nova tecnologia, 00:27:11.192 --> 00:27:15.363 de uma nova metodologia, porque ele não quer soar retrógrado, 00:27:15.363 --> 00:27:20.001 não quer gerar uma impressão que a gestão dele está atrasada. 00:27:20.001 --> 00:27:23.438 E aí tem todo um cuidado, porque nós estamos falando de pessoas, 00:27:23.438 --> 00:27:29.377 e elas precisam ser respeitadas porque estão dando o seu melhor. 00:27:29.377 --> 00:27:34.949 É muito fácil você vir de fora com as suas novas ideias. 00:27:34.949 --> 00:27:40.220 Você não está ali no dia a dia, matando um leão por dia. 00:27:40.220 --> 00:27:45.822 Então, a cultura vem junto com a questão política também, 00:27:45.822 --> 00:27:47.595 de se mostrar... 00:27:47.595 --> 00:27:50.198 Quem quiser fomentar essa cultura, esse mindset, 00:27:50.198 --> 00:27:55.837 precisa se mostrar como alguém que quer somar, alavancar, enfim, 00:27:55.837 --> 00:27:59.288 e não alguém que veio para dizer que está tudo errado, 00:27:59.288 --> 00:28:00.570 que você está fazendo tudo errado, 00:28:00.570 --> 00:28:05.830 vamos fazer agora dessa outra forma que é superdiferente e funciona. 00:28:05.830 --> 00:28:10.303 Até porque nada funciona saindo dos livros 00:28:10.303 --> 00:28:12.987 e sendo encaixado na realidade corporativa ali. 00:28:12.987 --> 00:28:14.839 Precisamos adaptar tudo. 00:28:14.839 --> 00:28:20.361 Então são aspectos mais complexos que as questões técnicas, não é, Lucas? 00:28:20.361 --> 00:28:23.364 Parece que até resolvemos mais rápido o técnico. 00:28:23.364 --> 00:28:25.900 Quando falamos de cultura, de questões políticas, 00:28:25.900 --> 00:28:29.070 elas são mais desafiadoras, mas precisam ser consideradas, 00:28:29.070 --> 00:28:31.313 senão você faz uma superimplementação 00:28:31.313 --> 00:28:35.743 e ninguém usa, né, enterra,ela morre ali. 00:28:35.743 --> 00:28:36.608 Exatamente. 00:28:36.608 --> 00:28:37.287 Muito bom! 00:28:37.287 --> 00:28:39.457 Gente, que papo bom! 00:28:39.457 --> 00:28:40.915 São muitas coisas. 00:28:40.915 --> 00:28:43.166 É o tipo do papo que temos que ouvir algumas vezes 00:28:43.166 --> 00:28:45.486 para poder extrair tudo o que está sendo dito. 00:28:45.486 --> 00:28:47.689 São nortes superimportantes. 00:28:47.689 --> 00:28:52.927 Mas tem um último ponto que eu queria te ouvir, aproveitar bem a sua experiência, 00:28:52.927 --> 00:28:55.563 que é a questão da segurança dos dados. 00:28:55.563 --> 00:28:59.417 Temos uma referência na Europa, 00:28:59.417 --> 00:29:03.547 na lei europeia de proteção aos dados. 00:29:03.547 --> 00:29:09.877 A LGPD já veio com alguns avanços, estabelecendo alguns limites. 00:29:09.877 --> 00:29:15.005 De novo, temos alguns desafios que são culturais aqui no Brasil. 00:29:16.117 --> 00:29:20.450 Como você vê a questão da segurança dos dados, num contexto analítico, 00:29:20.450 --> 00:29:25.245 onde muitas vezes você vai, de fato, armazenar ali, de forma agregada, 00:29:25.245 --> 00:29:29.063 todas as suas informações gerenciais? 00:29:29.063 --> 00:29:34.466 Quais cuidados, qual a maturidade brasileira nesse momento em relação ao assunto? 00:29:34.466 --> 00:29:39.607 Conforme a lei chegou, ela chegou para proteger, de fato, 00:29:39.607 --> 00:29:43.444 as pessoas que têm os dados compartilhados com outras empresas. 00:29:45.279 --> 00:29:49.552 Então ela talvez tenha chegado até um pouco tarde porque ela surgiu 00:29:49.552 --> 00:29:53.049 porque encontramos problemas de dados sendo vazados e tudo mais, 00:29:53.049 --> 00:29:57.358 justamente porque algumas práticas não estavam sendo utilizadas. 00:29:57.358 --> 00:30:01.763 Disponibilizamos dados sensíveis, que já conseguimos enxergar hoje 00:30:01.763 --> 00:30:04.224 essa diferença de dados sensíveis ou não, 00:30:04.224 --> 00:30:07.315 identificadores de usuários... 00:30:08.955 --> 00:30:10.905 Telefones, endereço, enfim, 00:30:10.905 --> 00:30:14.408 dados ali que podem ser utilizados de forma indevida. 00:30:14.408 --> 00:30:19.080 Tudo isso de forma muito acessível, que seria fácil de alguém mal intencionado 00:30:19.080 --> 00:30:22.884 conseguir extrair esses dados e utilizar para outras finalidades. 00:30:22.884 --> 00:30:27.455 Então, algumas etapas, algumas camadas de proteção, 00:30:27.455 --> 00:30:33.127 são desenvolvidas para mitigarmos, evitarmos esse tipo de situação. 00:30:33.127 --> 00:30:37.865 Obviamente, o acesso ao Data Warehouse, ao data lake, aos dados de origem, 00:30:37.865 --> 00:30:40.474 se alguém invadir esses sistemas, com certeza vamos ter um grande problema. 00:30:40.474 --> 00:30:45.006 Mas pensando em todo o funil de transformação de dados, 00:30:45.006 --> 00:30:47.675 todo esse processo que nós temos dentro de uma plataforma, 00:30:47.675 --> 00:30:52.747 são várias camadas que nós temos até chegar num dado sensível, 00:30:52.747 --> 00:30:56.739 Normalmente a ponta de visualização, a ponta de consumo, 00:30:56.739 --> 00:31:00.788 onde temos respostas ali para as nossas perguntas. 00:31:00.788 --> 00:31:05.893 não precisa necessariamente do CPF do cliente ou do telefone. 00:31:05.893 --> 00:31:08.096 Precisamos de números indicando 00:31:08.096 --> 00:31:10.396 se determinada campanha de marketing, por exemplo, 00:31:10.396 --> 00:31:13.034 está funcionando da forma esperada ou não. 00:31:13.034 --> 00:31:14.935 Então não precisamos de muitos detalhes. 00:31:14.935 --> 00:31:19.907 Os dados que ficam disponíveis para amplo acesso, 00:31:19.907 --> 00:31:24.396 seja interno ou dependendo até mesmo como um produto sendo exposto de alguma forma, 00:31:24.396 --> 00:31:28.638 são dados agregados, como você disse, métricas já calculadas, 00:31:28.638 --> 00:31:29.977 dados onde nós... 00:31:31.110 --> 00:31:32.506 Esses dados são anônimos. 00:31:32.506 --> 00:31:38.220 Não conseguimos vincular toda essa informação a pessoas, 00:31:38.220 --> 00:31:40.818 não conseguimos trazer insumos 00:31:40.818 --> 00:31:45.293 para ser utilizado de forma indevida por outras pessoas. 00:31:46.172 --> 00:31:51.802 Então eu acho que essas leis que surgiram, como temos implementado isso agora, 00:31:51.802 --> 00:31:54.908 já deveríamos estar fazendo isso bem antes. 00:31:54.908 --> 00:31:58.179 Agora, por ter virado, de fato, uma lei, 00:31:58.179 --> 00:32:02.254 principalmente o cenário nacional tem evoluído de uma forma interessante, 00:32:02.254 --> 00:32:04.644 temos nos preocupado cada vez mais com isso. 00:32:04.644 --> 00:32:07.197 E tem até diversos memes na internet também. 00:32:07.197 --> 00:32:10.057 Quando tem ali o vazamento de dados, 00:32:10.057 --> 00:32:12.660 daí começa-se a investir muito dinheiro e tudo mais. 00:32:12.660 --> 00:32:15.489 E não precisamos disso, porque se vazar, vão ter muitas multas, 00:32:15.489 --> 00:32:18.933 vão ter muitas coisas envolvidas, então ninguém quer que isso aconteça. 00:32:18.933 --> 00:32:22.703 Então, além de proteger o cliente, as empresas estão se protegendo também. 00:32:22.703 --> 00:32:26.054 Consequentemente, temos um cenário cada vez melhor 00:32:26.054 --> 00:32:28.742 pensando em proteção de dados. 00:32:28.742 --> 00:32:32.093 Ferramentas de governança estão sendo cada vez mais utilizadas 00:32:32.093 --> 00:32:34.315 para conseguirmos identificar o que é um dado sensível ou não, 00:32:34.315 --> 00:32:37.622 para protegê-los de uma forma mais eficiente. 00:32:37.622 --> 00:32:44.024 Ferramentas para dar nível de acesso de uma forma mais eficiente. 00:32:44.024 --> 00:32:45.523 Os próprios Data Warehouses. 00:32:45.523 --> 00:32:47.880 Hoje nós conseguimos dar acesso em nível de linha, 00:32:47.880 --> 00:32:49.930 nível de coluna de uma mesma tabela, 00:32:49.930 --> 00:32:53.601 o que acaba sendo muito mais prático também para esse tipo de proteção. 00:32:53.601 --> 00:32:57.938 Então toda essa tecnologia está em favor justamente de proteger, 00:32:57.938 --> 00:32:59.786 de como estamos utilizando esses dados. 00:32:59.786 --> 00:33:00.741 Muito bacana. 00:33:00.741 --> 00:33:02.886 E é um ganha ganha, né, como você diz. 00:33:02.886 --> 00:33:08.839 Todo mundo sai ganhando com uma postura mais ética e mais segura também. 00:33:08.839 --> 00:33:09.663 Com certeza. 00:33:09.663 --> 00:33:10.900 Muito bom, Lucas. 00:33:10.900 --> 00:33:13.343 Eu quero te agradecer né? 00:33:13.343 --> 00:33:16.657 Muito bom aprender com você, te ouvir, ouvir cases. 00:33:16.657 --> 00:33:20.658 Eu sei que você traz o frescor, a prática do mercado. 00:33:21.253 --> 00:33:22.515 O Lucas é professor. 00:33:22.515 --> 00:33:24.713 Eu acho que deu para vocês perceberem, né? 00:33:24.713 --> 00:33:30.485 Além de estar aí no contexto corporativo, ele também nos ensina aqui. 00:33:30.485 --> 00:33:34.938 E unir as duas coisas, fica uma delícia para os ouvidos, viu? 00:33:34.938 --> 00:33:36.210 Foi um prazer. 00:33:36.210 --> 00:33:36.777 Muito obrigado. 00:33:36.777 --> 00:33:39.179 Eu que agradeço a participação, o convite. 00:33:39.179 --> 00:33:41.515 Falar do intermake para mim é super importante 00:33:41.515 --> 00:33:44.451 Está presente em todos os meus dias do trabalho, 00:33:44.451 --> 00:33:48.535 então acaba sendo muito interessante poder compartilhar um pouquinho 00:33:48.535 --> 00:33:52.277 dessa experiência também, e também ouvir todos os seus pontos, né? 00:33:52.277 --> 00:33:55.086 A sua experiência também é muito boa. 00:33:55.086 --> 00:33:57.217 Sempre aprende um pouquinho mais nesses papos. 00:33:57.217 --> 00:33:58.396 Nós crescemos. 00:33:58.396 --> 00:34:01.346 E você também, que ficou conosco até agora, cresceu, 00:34:01.346 --> 00:34:05.459 e pôde perceber que nós temos uma série de papéis, 00:34:05.459 --> 00:34:09.409 muita tecnologia, várias ferramentas. 00:34:09.409 --> 00:34:12.187 A nossa dica, né, Lucas, é: comece. 00:34:12.187 --> 00:34:13.647 Tem muita oportunidade. 00:34:13.647 --> 00:34:17.017 Muita, muita, um mercado muito aquecido. 00:34:17.017 --> 00:34:18.519 Comece, vá mergulhando. 00:34:18.519 --> 00:34:22.055 Com o tempo você vai ganhando maturidade, visão arquitetural. 00:34:22.055 --> 00:34:24.625 O céu é o limite, de fato, nesse mercado de dados. 00:34:24.625 --> 00:34:27.060 Nós somos suspeitos, amamos tudo isso aqui. 00:34:27.060 --> 00:34:29.815 Queremos que você venha aqui para o nosso lado também.