-
Nos nossos estudos
de governança de TI,
-
nos estudos do COBIT,
-
que é o Guia de Boas Práticas
de Governança de TI,
-
foi incorporado,
na última versão,
-
toda uma parte especialmente
tratando de governança de dados.
-
A gente está cada vez
mais caminhando para um cenário
-
de empresas que tomam decisões
com base em dados.
-
Vamos lembrar, então,
daquele termo,
-
Data Driven Business,
negócios orientados a dados.
-
Como a empresa agora
passa a tomar decisões
-
de que outra empresa
ela vai comprar?
-
Que parte da empresa ela vai vender?
-
Que negócio ela vai rachar,
separar em dois?
-
Que novos produtos ela vai lançar?
-
Um produto antigo,
em que outra região ela pode lançar?
-
Que novo público cliente
ela pode atacar?
-
Cada vez mais essas informações
estão vindo da ciência de dados.
-
Cada vez mais essas decisões
estão baseadas em bancos de dados.
-
Sendo assim, a gente tem que ter
todo um cuidado,
-
uma governância e também
indicadores de desempenho
-
relacionados à questão
da governança dos dados.
-
Governança de dados
é entregar a informação correta
-
para a pessoa devidamente autorizada,
-
para que ela tome a melhor decisão
com base nessa informação.
-
A informação precisa estar disponível
para as pessoas certas,
-
no formato certo,
com o conteúdo perfeito,
-
correto, não contaminado,
para que a decisão correta venha.
-
Quais seriam os indicadores
de desempenho
-
que a gente poderia desenhar,
-
definir para a governança de dados
especificamente?
-
Vou citar aqui alguns indicadores
dos principais que a gente usa
-
dentro de uma área de tecnologia.
-
O primeiro deles
é a cobertura dos dados.
-
A empresa tem diversos
processos de trabalho,
-
opera sobre diversos produtos,
diversos mercados,
-
com diversas unidades de fábricas,
escritórios de serviços
-
ou de vendas.
-
Dentro dessa perspectiva,
eu preciso então,
-
mapear tudo aquilo que a empresa faz,
-
criando um painel dos departamentos,
das unidades de negócio
-
e das principais rotinas
que ela executa no dia a dia.
-
Quais são os processos que ela faz?
-
A área de compras que roda
na sede da empresa,
-
ela realiza as atividades
de seleção de fornecedores,
-
cotação, confirmação de compras,
acompanhamento de pedidos,
-
recepção de pedidos,
avaliação da qualidade de entrega
-
e disponibilização
do produto comprado
-
para aquele que demandou a compra.
-
Então eu citei aqui sete processos
que a área de compras faz.
-
Em seguida, a gente vai mapear
como que os sistemas de informação,
-
os bancos de dados da empresa
cobrem essas operações.
-
Será que todas essas atividades
da área de compras estão suportadas
-
por sistemas informacionais?
-
Ou será que a área
de compras ainda atua
-
com planilhas de cálculo na mão,
papel com anotações,
-
decisões tomadas
pela cabeça das pessoas?
-
Então esse primeiro indicador,
que é o indicador de cobertura,
-
vai te definir o quanto a tua área
de tecnologia está disponibilizando
-
de recursos para que a empresa
possa trabalhar orientada a dados.
-
Um outro indicador
seria a utilização desse dado.
-
Eu disponibilizei os sistemas,
dentro dos sistemas eu disponibilizei
-
uma série de conteúdos,
mas quais desses conteúdos
-
estão sendo usados,
aproveitados nas tomadas de decisão?
-
Então esse é um outro indicador, que é o uso do dado.
-
Quantas vezes aquele dado
foi acessado no último ano,
-
no último mês,
no último dia?
-
Vou dar um exemplo para você.
-
Hoje a gente trabalha muito
com Big Data,
-
trabalha muito com Data Lake.
-
O que é um Data Lake,
um lago de dados?
-
Eu capturo dados de diversas origens,
-
dados que vem de dentro
da minha empresa,
-
que são coletados dos próprios
departamentos da empresa,
-
que estão lá analisando o mercado,
analisando o produto,
-
analisando o cliente,
dados que vem de fora,
-
vem da internet,
de uma rede social,
-
de uma publicação feita lá
em um determinado jornal.
-
Então a empresa vai puxando
para dentro do seu banco de dados
-
uma série de conteúdos
que teoricamente interessam a ela.
-
Dando alguns exemplos,
eu tenho lá um streaming de vídeo
-
de uma reportagem feita
em um programa de entrevista noturno
-
em que foi entrevistado
o diretor executivo
-
de uma empresa concorrente da nossa.
-
E o pessoal de marketing
acha que é importante guardar isso,
-
e guardou essa gravação.
-
Também tem um podcast,
uma gravação de áudio
-
de uma outra entrevista feita
com um gerente de vendas
-
de um outro concorrente
e que saiu em um podcast lá
-
de um outro grupo jornalístico
e te interessou
-
e você jogou no Data Lake.
-
Também tem algumas outras
informações que vêm do pessoal
-
de estratégia de marketing
e que mapeou o valor do investimento
-
previsto que um concorrente
vai fazer no mercado.
-
Também mapeou o interesse
de um consumidor,
-
de um grupo consumidor
sobre um determinado produto.
-
E gerou uma régua
de avaliação de interesse.
-
Esse dado foi produzido
por um grupo interno da empresa.
-
Também tem um outro dado
de alguns internautas
-
que tem lá blogs e que falaram mal
de um produto nosso.
-
E isso me interessa.
-
Olha a quantidade de coisas
que você está trazendo para dentro
-
do seu Data Lake.
-
Aí vem a questão.
-
O que disso é útil?
-
Quanto disso está sendo usado
no dia a dia?
-
Vamos levar para outra perspectiva.
-
Eu tenho um BI.
-
O BI gera uma série
de informações cruzadas.
-
Quanto estou vendendo
de determinado produto em tal região?
-
Quanto estou vendendo do produto
na região separado por cliente?
-
Quanto estou vendendo na região
por produto por cliente
-
e por escritório de vendas
ou vendedor que atendeu esse cliente?
-
Então eu consigo ir detalhando
a informação de vendas
-
em diversos níveis.
-
O BI permite isso.
-
Eu estou gerando toda essa informação
dentro do meu sistema, pessoal.
-
Isso exige muito
processamento de dados.
-
Existe muita área de armazenamento
dedicada para guardar esses dados.
-
O custo disso é altíssimo.
-
E será que isso está sendo útil?
-
Então um dos indicadores
da governança de TI
-
é o quanto cada dado
que eu estou produzindo,
-
cada tabela de banco de dados
que eu tenho,
-
onde ela é acessada,
onde ela é consumida,
-
então quais partes de sistema
ela é consumida
-
e os usuários estão acessando
aquela tela de informação
-
que está conectada com aquela
tabela de banco
-
e que está trazendo aquele conteúdo?
-
Será que eles estão fazendo uso
daquele conteúdo?
-
Mapeando isso,
você vai poder tomar uma decisão
-
sobre expurgar dados desnecessários.
-
Você vai poder tomar
uma outra decisão
-
de talvez não expurgar alguns dados,
mas guardar em um histórico,
-
em uma mídia,
-
em um meio de armazenamento
mais barato,
-
deixando para guardar
na mídia nobre,
-
na mídia mais cara,
aquela mídia de alto desempenho,
-
aquilo que você está usando
no dia-a-dia.
-
Quando eu falo mídia,
eu estou me referindo,
-
por exemplo,
ao HD, hard disk,
-
que você tem aí no seu PC,
uma memória RAM,
-
ou uma memória SSD,
que substitui lá um HD,
-
é um dispositivo de memória
muito mais caro que o HD,
-
mas muito mais rápido.
-
Eu estou me referindo,
por exemplo,
-
a fitas e discos magnéticos
externos.
-
Então, eu posso ter dispositivos externos, de fita ou de discos, em
-
que o acesso, gravação e leitura é muito mais lento.
-
Só que esses dispositivos são mais baratos do que um HD interno.
-
Então, eu posso escolher onde eu vou colocar meus dados em função dos
-
indicadores de desempenho que eu defini.
-
Eu tenho lá um KPI, que aponta para mim o uso dos dados.
-
Se eu tenho um dado que é menos usado, com menos frequência, eu o
-
jogo para uma mídia mais barata.
-
Aquele dado que eu uso toda hora, todo dia, eu deixo na mídia mais
-
cara, com alto desempenho.
-
E aquele dado que eu nunca uso, eu expurgo.
-
Começa a entender agora a importância da governança baseada em
-
indicadores de desempenho?
-
Olha quanta coisa você pode fazer na área de tecnologia utilizando
-
esse método de gestão por indicadores, hein?