-
Você sabe o que é o sistema
de recomendação
-
e a sua importância para o meio digital?
-
Com a digitalização de processos,
inclusive no meio digital, no varejo,
-
é muito incomum nos depararmos
com algum site
-
de venda de produtos ou serviços,
-
que não possui algum
sistema de recomendação,
-
auxiliando na descoberta
de novos itens.
-
Mas, o que é o sistema
de recomendação em si?
-
Esse sistema é basicamente
um conjunto de algoritmos
-
que estão processando dados
de transações, de venda,
-
de relacionamento entre pessoas,
-
pessoas e produtos,
para indicar um outro serviço
-
ou produto que possa ser interessante
daquele mesmo contexto.
-
Nós vamos encontrar esse
tipo de solução
-
em vários sites de redes sociais,
por exemplo,
-
ou no YouTube,
ou no Deezer, no Spotify,
-
onde um produto que você
interage puxa o outro,
-
puxa uma próxima indicação.
-
Todo e-commerce de peso, na verdade,
tem também
-
sistema de recomendação
por trás deles,
-
indicando, por exemplo,
quem viu e comprou aquilo lá.
-
Pessoas que compraram esse item
também costumam levar
-
esses outros itens.
-
Esse recurso é muito interessante
para manter usuários engajados
-
com aquele serviço ou plataforma,
mas também,
-
para melhorar
o poder de venda daquela marca.
-
E a base para a construção
de sistema de recomendação
-
são dados históricos
de produtos e serviços
-
ou então também de usuários.
-
Portanto, por ser um trabalho
que envolve análise de dados,
-
é um produto de estudo de interesse
da ciência de dados também.
-
Vamos ver como que o processo
de ciência de dados clássico
-
se encaixa na construção
de um sistema de recomendação.
-
Nessa imagem,
-
temos o ciclo
de ciência de dados clássico,
-
ou seja, todo o processo
de ciência de dados
-
passa por esses estágios.
-
O primeiro ponto
também é o entendimento do negócio.
-
Aqui nós queremos entender
o que queremos recomendar?
-
Qual o objetivo dessa recomendação?
-
Por exemplo,
o interesse da Amazon
-
é você comprar mais produtos
para aumentar o lucro da loja.
-
Já na Netflix,
o interesse do sistema
-
é para você manter
o engajamento do usuário.
-
Como eles estão vendendo assinaturas,
-
a assinatura pode ser vendida
por uma pessoa que vê muito Netflix
-
ou que não vê quase nada.
-
Mas a pessoa que não está consumindo
muito daquele material,
-
daquele streaming,
pode acabar cancelando o serviço.
-
Portanto, quanto mais ela seja retida
naquele sistema,
-
mais ela continua consumindo
e, portanto,
-
não vai cancelar aquele serviço.
-
Quando a gente sabe o que
a gente quer construir,
-
nós temos que buscar os dados
que apoiam essa decisão.
-
Essa seleção de dados parte
sobretudo de conhecimento de usuário,
-
ou seja,
quem é esse usuário,
-
do que ele gosta,
do que não gosta,
-
mas também conhecimento
do estoque, digamos assim.
-
Como está o nosso estoque
de produtos?
-
Quais produtos nós vendemos?
-
Quais características desses produtos
ou serviços?
-
Mas também é muito importante,
ter um histórico de relação entre eles.
-
quem comprou o quê,
quem interagiu com o quê.
-
Portanto, no meio físico,
também é possível implementar
-
o sistema de recomendação.
-
Você pode ter a transação
de uma operação
-
que foi vendida, de fato,
naquela loja.
-
Agora, no meio digital,
-
a quantidade de dados
aumenta absurdamente.
-
Podemos coletar dados sobre
qual produto que o usuário clicou,
-
qual e-mail de venda ele abriu,
por exemplo.
-
Como estamos diante de muitos dados,
-
claramente temos que preparar
essa base
-
para permitir fazer a modelagem.
-
Na modelagem também temos
uma série de algoritmos
-
que podem ser aplicados
sobre esses dados,
-
cada um com a sua vantagem
e desvantagem.
-
Como todo modelo
de ciência de dados,
-
também é importante avaliá-lo antes
de colocar em produção.
-
Quando estamos avaliando
um sistema de recomendação,
-
pode ser que seja necessário
refinar a pergunta,
-
refinar a demanda.
-
Ou quando ele está bem estável,
digamos assim,
-
é possível colocá-lo
em desenvolvimento.
-
A parte da avaliação é a etapa
mais difícil
-
do processo de ciência de dados
para sistemas de recomendação,
-
porque, de fato, poder comprovar
-
se a pessoa compraria ou não
aquele produto é muito subjetivo.
-
A compra efetiva pode parecer
um produto de "n" fatores externos
-
que nós não temos como avaliar.
-
Por exemplo,
imagina que aquela recomendação
-
de um produto por uma pessoa
seja perfeita.
-
A pessoa sempre quis aquele produto,
mas naquele momento,
-
daquela interação do site,
-
a pessoa não tem dinheiro
para comprar aquele produto.
-
Não é um problema do link entre
o que eu ofereço e para qual usuário,
-
mas o fator externo impediu
a concretização daquela compra.
-
E não basta ter os dados coletados,
também é importante
-
manter uma relação entre eles.
-
A principal base de dados,
a principal forma de estruturar o dado
-
para poder fazer uma análise
de uma recomendação
-
é por meio de uma matriz de interação.
-
Vamos conhecê-la na próxima imagem.
-
A matriz de interação
faz uma relação entre produtos,
-
por exemplo,
livros e pessoas
-
que estão interagindo com esses livros.
-
Essa interação no meio digital
pode ser bem complexa,
-
pode ser simplesmente
clicar na página onde tem esse livro,
-
pode ser clicar,
mas também
-
folhear algumas páginas virtualmente
-
ou pode até ser de fato,
colocar no carrinho
-
e até mesmo efetivar a compra.
-
Ou seja, a força dessa interação
pode ser mais forte ou mais fraca.
-
Em todo o caso,
um pequeno exemplo
-
já é possível notar que essa matriz
deve ser muito grande
-
e também muito esparsa.
-
Ela é muito grande porque podemos ter
vários produtos naquela loja.
-
E pode ser também grande
no sentido de muitas linhas,
-
porque nossa base de clientes
é muito grande também.
-
E os desafios para trabalhar
com sistema de recomendação
-
pode ser justamente o tamanho
dessa matriz.
-
Se essa matriz é muito complexa,
muito grande,
-
com uma alta dimensão
isso vai colocar um esforço,
-
uma necessidade muito grande
de poder condicional
-
para dar conta dessa relação
-
de usuários, clientes
e produtos também.
-
E já que trabalhar
com essa matriz grande
-
pode exigir um esforço promocional
muito grande
-
e se eu colocar uma complexidade
na escalabilidade da solução,
-
rodar esses algoritmos para criar
boas recomendações
-
pode ser muito custoso.
-
E lembrando que a matriz também
é muito esparsa,
-
nós temos um outro problema,
uma limitação técnica,
-
que é da esparsidade.
-
Ou seja, por ser uma matriz
que tem muitas lacunas,
-
falhas de dados,
pode ser difícil conseguir fazer
-
com que os algoritmos convirjam
para uma boa relação
-
entre produtos e/ou usuários.
-
Outro problema muito importante
em cima de recomendação,
-
é o problema chamado "cold start".
-
Ou seja,
-
como nós vamos começar
a interagir com o usuário
-
se nós não conhecemos
quem é esse usuário
-
e o que ele pode comprar nessa loja.
-
Ou seja,
é primeiro dar a "partida a frio".
-
Nós não temos informação suficiente
-
para conseguir conhecer quem
esse usuário é
-
ou do que ele gosta,
para fazer recomendações assertivas.
-
Geralmente,
para contornar esse problema,
-
nós partimos para modelagens
mais simples,
-
como recomendar produtos populares.
-
Se um produto ou serviço é popular,
-
é porque muita gente gosta, interage
ou consome esse produto.
-
Então, se eu não conheço quem é
o usuário que vai interagir com ele,
-
recomendar o que todo mundo gosta
pode ter maior chance de agradá-lo.
-
E já que estamos no mundo de dados,
-
outro problema
pode ser a proteção de dados.
-
Para a gente conseguir entender
quem é o usuário e o que ele gosta,
-
é importante nós termos acesso
a esse tipo de informação.
-
Se pela LGPD o usuário
não dá o consentimento
-
de uso desse tipo de informação,
-
nós não podemos, então, utilizar
esse tipo de dado histórico
-
para fazer uma recomendação
mais assertiva.