-
Você sabe o que é o sistema
de recomendação
-
e sua importância para o meio digital?
-
Com a digitalização de processos,
inclusive no meio digital,
-
no varejo.
-
É muito incomum nos depararmos
com algum site de venda de produtos
-
ou serviços que não possui
um sistema de recomendação,
-
auxiliando a descoberta de novos itens.
-
Mas, o que é o sistema
de recomendação em si?
-
Esse sistema é basicamente
um conjunto de algoritmos
-
que estão processando dados
de transações,
-
de venda,
de relacionamento entre pessoas,
-
pessoas e produtos
para indicar um outro serviço
-
ou produto que possa ser interessante
daquele mesmo contexto.
-
Nós vamos encontrar
esse tipo de solução
-
em vários sites de redes sociais,
por exemplo,
-
ou no YouTube,
ou no Dizer, no Spotify,
-
onde um produto que você
interage puxa outro,
-
puxa a próxima indicação.
-
Todo e-commerce de peso,
na verdade,
-
tem também sistema de recomendação
por trás deles,
-
indicando, por exemplo,
quem viu comprou aquilo lá.
-
Pessoas que compraram esse item
também costumam levar
-
esses outros itens também.
-
Esse recurso é muito interessante
para manter usuários engajados
-
com aquele serviço ou plataforma,
mas também,
-
para melhorar
o poder de venda daquela marca.
-
E a base para a construção
de sistema de recomendação
-
são dados históricos
de produtos e serviços
-
ou então também de usuários.
-
Portanto, por ser um trabalho
que envolve análise de dados
-
é um produto de estudo de interesse
da ciência de dados também.
-
Vamos ver como que o processo
de ciência de dados clássico
-
se encaixa na construção
de um sistema de recomendação.
-
Nessa imagem temos o ciclo
de ciência de dados clássico,
-
ou seja, todo
o processo de ciência de dados
-
passa por esses estágios.
-
O primeiro ponto
também é o entendimento do negócio.
-
Aqui nós queremos entender
o que nós queremos recomendar?
-
Qual o objetivo dessa recomendação?
-
Por exemplo,
o interesse da Amazon
-
é você comprar mais produtos
para aumentar o lucro da loja.
-
Já no Netflix,
o interesse do sistema
-
é para você manter
o engajamento do usuário.
-
Como eles estão vendendo assinaturas,
-
a assinatura pode ser vendida
por uma pessoa que vê muito Netflix
-
ou que não vê quase nada.
-
Mas a pessoa que não está consumindo
muito daquele material,
-
daquele streaming,
pode acabar cancelando o serviço.
-
Portanto, quanto mais ela seja retida
naquele sistema,
-
mais ela continua consumindo
e, portanto,
-
não vai cancelar aquele serviço.
-
Quando a gente sabe o que
a gente quer construir,
-
nós temos que buscar os dados
que apoiam essa decisão.
-
Essa seleção de dados parte
sobretudo de conhecimento de usuário.
-
Ou seja, quem é esse usuário
-
e do que ele gosta, o que não gosta,
mas tem conhecimento do estoque.
-
Digamos assim.
-
Como está nosso estoque de produtos?
-
Que produtos nós vendemos?
-
Quais as características desses produtos
ou serviços?
-
Mas também é muito importante
-
ter um histórico de relação entre eles
quem comprou, quem interagiu com o quê.
-
Portanto, no meio físico também é possível
implementar o sistema de recomendação.
-
Você pode ter a transação
-
de uma operação foi vendida de fato
naquela loja.
-
Agora, no meio digital, a quantidade de
dados aumenta absurdamente.
-
Nós podemos coletar dados
sobre qual o produto que um usuário
-
clicou, qual e-mail de venda
ele abriu, por exemplo.
-
Como estamos diante de muitos dados,
-
claramente temos que preparar essa base
para permitir fazer a modelagem.
-
Na modelagem também temos uma série
de algoritmos que podem ser aplicados
-
sobre esses dados,
cada um com sua vantagem e desvantagem.
-
Como todo modelo de ciência de dados,
-
também importante
avaliá lo antes e colocar em produção.
-
Quando nós estamos avaliando
o consumo de comunicação pode ser que seja
-
necessário refinar a pergunta,
refinar a demanda ou quando ele está bem
-
estável, digamos assim,
é possível colocá lo em desenvolvimento?
-
A parte da avaliação etapa mais difícil
-
do processo de ciência de dados
para sistemas de recomendação,
-
porque ele de fato poder comprovar
-
se a pessoa compraria ou não
aquele produto é muito subjetivo.
-
A compra efetiva pode parecer um produto
-
de fatores externos que nós
não temos como avaliar.
-
Por exemplo,
imagina que aquela recomendação
-
de um produto por uma pessoa
seja perfeita.
-
A pessoa sempre quis aquele produto,
-
mas naquele momento,
daquela interação do site,
-
a pessoa não tem dinheiro para comprar
aquele produto.
-
Não é um problema do link
entre o que eu ofereço para qual usuário,
-
mas o fator externo impediu
a concretização daquilo aquela compra.
-
E não basta ter os dados coletados, também
-
é importante manter uma relação
entre eles.
-
A principal base de dados,
a principal forma de estruturar o dado
-
para poder fazer uma análise
mais de comunicação
-
é por meio de uma matriz de interação.
-
Vamos conhecê la na própria imagem.
-
A matriz de interação faz uma relação
entre produtos, por exemplo, livros
-
e pessoas
que estão interagindo com esses livros.
-
Essa interação no meio digital
pode ser bem complexa,
-
pode ser simplesmente
clicar na página ou item.
-
Esse livro pode ser clicar, mas também
folhear algumas páginas virtualmente.
-
Ou pode ter de ser de fato, colocar
no carrinho e até mesmo efetivar a compra.
-
Ou seja, a força de interação
pode ser mais forte ou mais fraca
-
em todo o caso, um pequeno exemplo
já é possível notar que essa matriz
-
deve ser muito grande
e também muito esparsa.
-
Ela é muito grande porque
podemos ter vários produtos naquela loja
-
e pode ser também grande
no sentido de muitas linhas,
-
porque nossa base de clientes
é muito grande também.
-
E os desafios
-
para trabalhar com sistema de recomendação
pode ser justamente o tamanho da matriz.
-
Se essa matriz é muito complexa,
muito grande, com uma outra dimensão
-
e vai colocar um esforço, uma necessidade
muito grande de poder condicional
-
para dar conta dessa relação
de usuários e clientes e produtos também.
-
E já que trabalhar com essa matriz grande
pode exigir um esforço emocional
-
muito grande e se colocar uma complexidade
na escalabilidade da solução.
-
Rodar esses algoritmos para criar
boas recomendações pode ser muito custoso.
-
E lembrando que a matriz também
é muito esparsa,
-
Nós temos um outro problema, uma limitação
técnica, que é da espasticidade.
-
Ou seja, por ser uma matriz
que tem muitas lacunas, falhas de dados,
-
pode ser difícil conseguir
fazer com que os algoritmos convirjam
-
para uma boa relação
entre produtos e ou usuários.
-
Outro problema
-
muito importante em cima de acumulação
é o problema chamado constante.
-
Ou seja, como nós
vamos começar a interagir com o usuário
-
que nós não conhecemos?
-
Quem é esse usuário
que ele pode comprar essa loja?
-
Ou seja, é o primeiro da partida Frio.
-
Nós não temos informação suficiente
para conseguir conhecer o que uso,
-
quem é o usuário e do que ele gosta
para fazer recomendações assertivas.
-
Geralmente, para contornar esse problema,
nós partimos
-
para modelagens mais simples,
como recomendar produtos populares.
-
Se um produto ou serviço é popular,
-
é porque muita gente gosta ou interage
com os como esse produto.
-
Então, se eu não conheço quem é o usuário
que vai interagir com ele?
-
Recomendar que todo mundo gosta
pode ter maior chance de agradá lo.
-
E já que estamos no mundo de dados,
-
outro problema
pode ser a proteção de dados para a gente
-
conseguir entender quem é o usuário
e o que ele gosta é importante.
-
Nós temos acesso
a esse tipo de informação.
-
Se pela LGPD o usuário não tem,
não dá o consentimento de uso
-
desse tipo de informação, Nós não podemos
-
então utilizar esse tipo de dado histórico
para fazer uma
-
comunicação mais assertiva.