-
Você sabe
o que é o sistema de recomendação
-
e sua importância para o meio digital
-
quando estilização de processos,
inclusive no meio digital, no varejo.
-
É muito incomum nos depararmos
com algum site de venda
-
de produtos ou serviços
que não possui um sistema de recomendação,
-
auxiliando a descoberta de novos itens
-
de recomendação em.
-
Enfim, esse sistema é basicamente
um conjunto de algoritmos
-
que estão processando dados de transações
de venda de relacionamento entre pessoas
-
e pessoas e produtos
para indicar um outro serviço
-
ou produto que possa ser interessante
daquele mesmo contexto.
-
Nós vamos encontrar esse tipo de solução
em vários sites de redes
-
sociais, por exemplo, ou no YouTube,
ou dizer no Spotify,
-
onde há um produto que você
interage e puxa, outro puxa mais próxima.
-
É indicação.
-
Todo e-commerce de peso,
na verdade, tem também uma recomendação
-
por trás deles, indicando, por exemplo,
quem viu comprou aquilo lá.
-
Pessoas que compraram esse item
também costumam levar esses
-
e outros itens também.
-
Esse recurso é muito interessante
para manter usuários engajados
-
com aquele serviço ou plataforma,
-
mas também para melhorar
o poder de venda daquela marca.
-
É a base para a construção
de sistema de recomendação.
-
São dados históricos de produtos
e serviços ou então também de usuários.
-
Portanto, por ser um trabalho
que envolve análise de dados
-
e um produto de estudo,
é de interesse da ciência de dados.
-
Também
-
vamos ver como que o processo de ciência
de dados clássico
-
se encaixa na construção
de um sistema de recomendação.
-
Nessa imagem
-
temos o ciclo de ciência de dados
clássico,
-
ou seja, todo
o processo de ciência de dados
-
passa por esses estágios.
-
O primeiro ponto
também é o entendimento do negócio.
-
Aqui nós queremos entender
o que nós queremos recomendar.
-
Qual o objetivo dessa recomendação?
-
Por exemplo, o interesse da Amazon
-
é você comprar mais produtos
para aumentar o lucro da loja.
-
Já no Netflix, o interesse do sistema é
para você manter o engajamento do usuário.
-
Como ele está vendendo assinaturas?
-
A assinatura pode ser vendida
-
por uma pessoa que vê muito Netflix
ou que não vê quase nada.
-
Mas a pessoa que não está consumindo muito
daquele material
-
daquele streaming
pode acabar cancelando o serviço.
-
Portanto, quanto mais ela seja retida
naquele sistema,
-
mais ela continua consumindo e,
portanto, não vai cancelar aquele serviço.
-
Quando a gente sabe o que quer
-
construir, nós temos que buscar os dados
que apoiam essa decisão.
-
Essa seleção de dados parte
sobretudo de conhecimento de usuário.
-
Ou seja, quem é esse usuário
-
e do que ele gosta, o que não gosta,
mas tem conhecimento do estoque.
-
Digamos assim.
-
Como está nosso estoque de produtos?
-
Que produtos nós vendemos?
-
Quais as características desses produtos
ou serviços?
-
Mas também é muito importante
-
ter um histórico de relação entre eles
quem comprou, quem interagiu com o quê.
-
Portanto, no meio físico também é possível
implementar o sistema de recomendação.
-
Você pode ter a transação
-
de uma operação foi vendida de fato
naquela loja.
-
Agora, no meio digital, a quantidade de
dados aumenta absurdamente.
-
Nós podemos coletar dados
sobre qual o produto que um usuário
-
clicou, qual e-mail de venda
ele abriu, por exemplo.
-
Como estamos diante de muitos dados,
-
claramente temos que preparar essa base
para permitir fazer a modelagem.
-
Na modelagem também temos uma série
de algoritmos que podem ser aplicados
-
sobre esses dados,
cada um com sua vantagem e desvantagem.
-
Como todo modelo de ciência de dados,
-
também importante
avaliá lo antes e colocar em produção.
-
Quando nós estamos avaliando
o consumo de comunicação pode ser que seja
-
necessário refinar a pergunta,
refinar a demanda ou quando ele está bem
-
estável, digamos assim,
é possível colocá lo em desenvolvimento?
-
A parte da avaliação etapa mais difícil
-
do processo de ciência de dados
para sistemas de recomendação,
-
porque ele de fato poder comprovar
-
se a pessoa compraria ou não
aquele produto é muito subjetivo.
-
A compra efetiva pode parecer um produto
-
de fatores externos que nós
não temos como avaliar.
-
Por exemplo,
imagina que aquela recomendação
-
de um produto por uma pessoa
seja perfeita.
-
A pessoa sempre quis aquele produto,
-
mas naquele momento,
daquela interação do site,
-
a pessoa não tem dinheiro para comprar
aquele produto.
-
Não é um problema do link
entre o que eu ofereço para qual usuário,
-
mas o fator externo impediu
a concretização daquilo aquela compra.
-
E não basta ter os dados coletados, também
-
é importante manter uma relação
entre eles.
-
A principal base de dados,
a principal forma de estruturar o dado
-
para poder fazer uma análise
mais de comunicação
-
é por meio de uma matriz de interação.
-
Vamos conhecê la na própria imagem.
-
A matriz de interação faz uma relação
entre produtos, por exemplo, livros
-
e pessoas
que estão interagindo com esses livros.
-
Essa interação no meio digital
pode ser bem complexa,
-
pode ser simplesmente
clicar na página ou item.
-
Esse livro pode ser clicar, mas também
folhear algumas páginas virtualmente.
-
Ou pode ter de ser de fato, colocar
no carrinho e até mesmo efetivar a compra.
-
Ou seja, a força de interação
pode ser mais forte ou mais fraca
-
em todo o caso, um pequeno exemplo
já é possível notar que essa matriz
-
deve ser muito grande
e também muito esparsa.
-
Ela é muito grande porque
podemos ter vários produtos naquela loja
-
e pode ser também grande
no sentido de muitas linhas,
-
porque nossa base de clientes
é muito grande também.
-
E os desafios
-
para trabalhar com sistema de recomendação
pode ser justamente o tamanho da matriz.
-
Se essa matriz é muito complexa,
muito grande, com uma outra dimensão
-
e vai colocar um esforço, uma necessidade
muito grande de poder condicional
-
para dar conta dessa relação
de usuários e clientes e produtos também.
-
E já que trabalhar com essa matriz grande
pode exigir um esforço emocional
-
muito grande e se colocar uma complexidade
na escalabilidade da solução.
-
Rodar esses algoritmos para criar
boas recomendações pode ser muito custoso.
-
E lembrando que a matriz também
é muito esparsa,
-
Nós temos um outro problema, uma limitação
técnica, que é da espasticidade.
-
Ou seja, por ser uma matriz
que tem muitas lacunas, falhas de dados,
-
pode ser difícil conseguir
fazer com que os algoritmos convirjam
-
para uma boa relação
entre produtos e ou usuários.
-
Outro problema
-
muito importante em cima de acumulação
é o problema chamado constante.
-
Ou seja, como nós
vamos começar a interagir com o usuário
-
que nós não conhecemos?
-
Quem é esse usuário
que ele pode comprar essa loja?
-
Ou seja, é o primeiro da partida Frio.
-
Nós não temos informação suficiente
para conseguir conhecer o que uso,
-
quem é o usuário e do que ele gosta
para fazer recomendações assertivas.
-
Geralmente, para contornar esse problema,
nós partimos
-
para modelagens mais simples,
como recomendar produtos populares.
-
Se um produto ou serviço é popular,
-
é porque muita gente gosta ou interage
com os como esse produto.
-
Então, se eu não conheço quem é o usuário
que vai interagir com ele?
-
Recomendar que todo mundo gosta
pode ter maior chance de agradá lo.
-
E já que estamos no mundo de dados,
-
outro problema
pode ser a proteção de dados para a gente
-
conseguir entender quem é o usuário
e o que ele gosta é importante.
-
Nós temos acesso
a esse tipo de informação.
-
Se pela LGPD o usuário não tem,
não dá o consentimento de uso
-
desse tipo de informação, Nós não podemos
-
então utilizar esse tipo de dado histórico
para fazer uma
-
comunicação mais assertiva.