< Return to Video

MLM CAP06 2025 VA01 SISTEMAS DE RECOMENDACAO INTRODUCAO

  • 0:08 - 0:10
    Você sabe o que é o sistema
    de recomendação
  • 0:10 - 0:12
    e a sua importância para o meio digital?
  • 0:12 - 0:16
    Com a digitalização de processos,
    inclusive no meio digital, no varejo,
  • 0:16 - 0:19
    é muito incomum nos depararmos
    com algum site
  • 0:19 - 0:21
    de venda de produtos ou serviços,
  • 0:21 - 0:23
    que não possui algum
    sistema de recomendação,
  • 0:23 - 0:25
    auxiliando na descoberta
    de novos itens.
  • 0:25 - 0:28
    Mas, o que é o sistema
    de recomendação em si?
  • 0:28 - 0:30
    Esse sistema é basicamente
    um conjunto de algoritmos
  • 0:30 - 0:33
    que estão processando dados
    de transações, de venda,
  • 0:33 - 0:36
    de relacionamento entre pessoas,
  • 0:36 - 0:40
    pessoas e produtos,
    para indicar um outro serviço
  • 0:40 - 0:44
    ou produto que possa ser interessante
    daquele mesmo contexto.
  • 0:44 - 0:45
    Nós vamos encontrar esse
    tipo de solução
  • 0:45 - 0:49
    em vários sites de redes sociais,
    por exemplo,
  • 0:49 - 0:52
    ou no YouTube,
    ou no Deezer, no Spotify,
  • 0:52 - 0:56
    onde um produto que você
    interage puxa o outro,
  • 0:56 - 0:58
    puxa uma próxima indicação.
  • 0:58 - 1:00
    Todo e-commerce de peso, na verdade,
    tem também
  • 1:00 - 1:02
    sistema de recomendação
    por trás deles,
  • 1:02 - 1:06
    indicando, por exemplo,
    quem viu e comprou aquilo lá.
  • 1:06 - 1:08
    Pessoas que compraram esse item
    também costumam levar
  • 1:08 - 1:09
    esses outros itens.
  • 1:09 - 1:13
    Esse recurso é muito interessante
    para manter usuários engajados
  • 1:13 - 1:16
    com aquele serviço ou plataforma,
    mas também,
  • 1:16 - 1:19
    para melhorar
    o poder de venda daquela marca.
  • 1:19 - 1:22
    E a base para a construção
    de sistema de recomendação
  • 1:22 - 1:25
    são dados históricos
    de produtos e serviços
  • 1:25 - 1:27
    ou então também de usuários.
  • 1:27 - 1:30
    Portanto, por ser um trabalho
    que envolve análise de dados,
  • 1:30 - 1:34
    é um produto de estudo de interesse
    da ciência de dados também.
  • 1:34 - 1:37
    Vamos ver como que o processo
    de ciência de dados clássico
  • 1:37 - 1:39
    se encaixa na construção
    de um sistema de recomendação.
  • 1:39 - 1:40
    Nessa imagem,
  • 1:40 - 1:43
    temos o ciclo
    de ciência de dados clássico,
  • 1:43 - 1:45
    ou seja, todo o processo
    de ciência de dados
  • 1:45 - 1:46
    passa por esses estágios.
  • 1:46 - 1:50
    O primeiro ponto
    também é o entendimento do negócio.
  • 1:50 - 1:52
    Aqui nós queremos entender
    o que queremos recomendar?
  • 1:52 - 1:54
    Qual o objetivo dessa recomendação?
  • 1:54 - 1:55
    Por exemplo,
    o interesse da Amazon
  • 1:55 - 1:59
    é você comprar mais produtos
    para aumentar o lucro da loja.
  • 1:59 - 2:01
    Já na Netflix,
    o interesse do sistema
  • 2:01 - 2:04
    é para você manter
    o engajamento do usuário.
  • 2:04 - 2:05
    Como eles estão vendendo assinaturas,
  • 2:05 - 2:09
    a assinatura pode ser vendida
    por uma pessoa que vê muito Netflix
  • 2:09 - 2:11
    ou que não vê quase nada.
  • 2:11 - 2:13
    Mas a pessoa que não está consumindo
    muito daquele material,
  • 2:13 - 2:16
    daquele streaming,
    pode acabar cancelando o serviço.
  • 2:16 - 2:20
    Portanto, quanto mais ela seja retida
    naquele sistema,
  • 2:20 - 2:21
    mais ela continua consumindo
    e, portanto,
  • 2:21 - 2:23
    não vai cancelar aquele serviço.
  • 2:23 - 2:25
    Quando a gente sabe o que
    a gente quer construir,
  • 2:25 - 2:27
    nós temos que buscar os dados
    que apoiam essa decisão.
  • 2:27 - 2:31
    Essa seleção de dados parte
    sobretudo de conhecimento de usuário,
  • 2:31 - 2:33
    ou seja,
    quem é esse usuário,
  • 2:33 - 2:35
    do que ele gosta,
    do que não gosta,
  • 2:35 - 2:38
    mas também conhecimento
    do estoque, digamos assim.
  • 2:38 - 2:40
    Como está o nosso estoque
    de produtos?
  • 2:40 - 2:41
    Quais produtos nós vendemos?
  • 2:41 - 2:43
    Quais características desses produtos
    ou serviços?
  • 2:43 - 2:46
    Mas também é muito importante,
    ter um histórico de relação entre eles.
  • 2:46 - 2:49
    quem comprou o quê,
    quem interagiu com o quê.
  • 2:49 - 2:52
    Portanto, no meio físico,
    também é possível implementar
  • 2:52 - 2:53
    o sistema de recomendação.
  • 2:53 - 2:56
    Você pode ter a transação
    de uma operação
  • 2:56 - 2:58
    que foi vendida, de fato,
    naquela loja.
  • 2:58 - 2:59
    Agora, no meio digital,
  • 2:59 - 3:02
    a quantidade de dados
    aumenta absurdamente.
  • 3:02 - 3:06
    Podemos coletar dados sobre
    qual produto que o usuário clicou,
  • 3:06 - 3:08
    qual e-mail de venda ele abriu,
    por exemplo.
  • 3:08 - 3:10
    Como estamos diante de muitos dados,
  • 3:10 - 3:12
    claramente temos que preparar
    essa base
  • 3:12 - 3:13
    para permitir fazer a modelagem.
  • 3:13 - 3:15
    Na modelagem também temos
    uma série de algoritmos
  • 3:15 - 3:17
    que podem ser aplicados
    sobre esses dados,
  • 3:17 - 3:20
    cada um com a sua vantagem
    e desvantagem.
  • 3:20 - 3:22
    Como todo modelo
    de ciência de dados,
  • 3:22 - 3:26
    também é importante avaliá-lo antes
    de colocar em produção.
  • 3:26 - 3:28
    Quando estamos avaliando
    um sistema de recomendação,
  • 3:28 - 3:30
    pode ser que seja necessário
    refinar a pergunta,
  • 3:30 - 3:32
    refinar a demanda.
  • 3:32 - 3:34
    Ou quando ele está bem estável,
    digamos assim,
  • 3:34 - 3:36
    é possível colocá-lo
    em desenvolvimento.
  • 3:36 - 3:39
    A parte da avaliação é a etapa
    mais difícil
  • 3:39 - 3:42
    do processo de ciência de dados
    para sistemas de recomendação,
  • 3:42 - 3:44
    porque, de fato, poder comprovar
  • 3:44 - 3:47
    se a pessoa compraria ou não
    aquele produto é muito subjetivo.
  • 3:47 - 3:52
    A compra efetiva pode parecer
    um produto de "n" fatores externos
  • 3:52 - 3:54
    que nós não temos como avaliar.
  • 3:54 - 3:56
    Por exemplo,
    imagina que aquela recomendação
  • 3:56 - 3:58
    de um produto por uma pessoa
    seja perfeita.
  • 3:58 - 4:02
    A pessoa sempre quis aquele produto,
    mas naquele momento,
  • 4:02 - 4:03
    daquela interação do site,
  • 4:03 - 4:06
    a pessoa não tem dinheiro
    para comprar aquele produto.
  • 4:06 - 4:10
    Não é um problema do link entre
    o que eu ofereço e para qual usuário,
  • 4:10 - 4:14
    mas o fator externo impediu
    a concretização daquela compra.
  • 4:14 - 4:17
    E não basta ter os dados coletados,
    também é importante
  • 4:17 - 4:19
    manter uma relação entre eles.
  • 4:19 - 4:23
    A principal base de dados,
    a principal forma de estruturar o dado
  • 4:23 - 4:25
    para poder fazer uma análise
    de uma recomendação
  • 4:25 - 4:26
    é por meio de uma matriz de interação.
  • 4:26 - 4:28
    Vamos conhecê-la na próxima imagem.
  • 4:28 - 4:31
    A matriz de interação
    faz uma relação entre produtos,
  • 4:31 - 4:34
    por exemplo,
    livros e pessoas
  • 4:34 - 4:37
    que estão interagindo com esses livros.
  • 4:37 - 4:40
    Essa interação no meio digital
    pode ser bem complexa,
  • 4:40 - 4:43
    pode ser simplesmente
    clicar na página onde tem esse livro,
  • 4:43 - 4:45
    pode ser clicar,
    mas também
  • 4:45 - 4:47
    folhear algumas páginas virtualmente
  • 4:47 - 4:49
    ou pode até ser de fato,
    colocar no carrinho
  • 4:49 - 4:52
    e até mesmo efetivar a compra.
  • 4:52 - 4:56
    Ou seja, a força dessa interação
    pode ser mais forte ou mais fraca.
  • 4:56 - 4:58
    Em todo o caso,
    um pequeno exemplo
  • 4:58 - 5:01
    já é possível notar que essa matriz
    deve ser muito grande
  • 5:01 - 5:02
    e também muito esparsa.
  • 5:02 - 5:07
    Ela é muito grande porque podemos ter
    vários produtos naquela loja.
  • 5:07 - 5:10
    E pode ser também grande
    no sentido de muitas linhas,
  • 5:10 - 5:12
    porque nossa base de clientes
    é muito grande também.
  • 5:12 - 5:15
    E os desafios para trabalhar
    com sistema de recomendação
  • 5:15 - 5:17
    pode ser justamente o tamanho
    dessa matriz.
  • 5:17 - 5:19
    Se essa matriz é muito complexa,
    muito grande,
  • 5:19 - 5:23
    com uma alta dimensão
    isso vai colocar um esforço,
  • 5:23 - 5:25
    uma necessidade muito grande
    de poder condicional
  • 5:25 - 5:26
    para dar conta dessa relação
  • 5:26 - 5:29
    de usuários, clientes
    e produtos também.
  • 5:29 - 5:31
    E já que trabalhar
    com essa matriz grande
  • 5:31 - 5:34
    pode exigir um esforço promocional
    muito grande
  • 5:34 - 5:37
    e se eu colocar uma complexidade
    na escalabilidade da solução,
  • 5:37 - 5:40
    rodar esses algoritmos para criar
    boas recomendações
  • 5:40 - 5:41
    pode ser muito custoso.
  • 5:41 - 5:43
    E lembrando que a matriz também
    é muito esparsa,
  • 5:43 - 5:46
    nós temos um outro problema,
    uma limitação técnica,
  • 5:46 - 5:47
    que é da esparsidade.
  • 5:47 - 5:49
    Ou seja, por ser uma matriz
    que tem muitas lacunas,
  • 5:49 - 5:52
    falhas de dados,
    pode ser difícil conseguir fazer
  • 5:52 - 5:55
    com que os algoritmos convirjam
    para uma boa relação
  • 5:55 - 5:56
    entre produtos e/ou usuários.
  • 5:56 - 5:59
    Outro problema muito importante
    em cima de recomendação,
  • 5:59 - 6:01
    é o problema chamado "cold start".
  • 6:01 - 6:01
    Ou seja,
  • 6:01 - 6:04
    como nós vamos começar
    a interagir com o usuário
  • 6:04 - 6:06
    se nós não conhecemos
    quem é esse usuário
  • 6:06 - 6:08
    e o que ele pode comprar nessa loja.
  • 6:08 - 6:10
    Ou seja,
    é primeiro dar a "partida a frio".
  • 6:10 - 6:12
    Nós não temos informação suficiente
  • 6:12 - 6:15
    para conseguir conhecer quem
    esse usuário é
  • 6:15 - 6:17
    ou do que ele gosta,
    para fazer recomendações assertivas.
  • 6:17 - 6:20
    Geralmente,
    para contornar esse problema,
  • 6:20 - 6:22
    nós partimos para modelagens
    mais simples,
  • 6:22 - 6:24
    como recomendar produtos populares.
  • 6:24 - 6:26
    Se um produto ou serviço é popular,
  • 6:26 - 6:30
    é porque muita gente gosta, interage
    ou consome esse produto.
  • 6:30 - 6:33
    Então, se eu não conheço quem é
    o usuário que vai interagir com ele,
  • 6:33 - 6:36
    recomendar o que todo mundo gosta
    pode ter maior chance de agradá-lo.
  • 6:36 - 6:38
    E já que estamos no mundo de dados,
  • 6:38 - 6:40
    outro problema
    pode ser a proteção de dados.
  • 6:40 - 6:44
    Para a gente conseguir entender
    quem é o usuário e o que ele gosta,
  • 6:44 - 6:47
    é importante nós termos acesso
    a esse tipo de informação.
  • 6:47 - 6:51
    Se pela LGPD o usuário
    não dá o consentimento
  • 6:51 - 6:52
    de uso desse tipo de informação,
  • 6:52 - 6:56
    nós não podemos, então, utilizar
    esse tipo de dado histórico
  • 6:56 - 6:57
    para fazer uma recomendação
    mais assertiva.
Title:
MLM CAP06 2025 VA01 SISTEMAS DE RECOMENDACAO INTRODUCAO
Video Language:
Portuguese, Brazilian
Duration:
07:01

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions