MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI

Rollback to version 11

0:08 - 0:11

Como nós construímos
regras de associação?
0:11 - 0:14

Existem diversas formas de você
encontrar uma associação
0:14 - 0:16

entre um produto e outro.
0:16 - 0:18

Aqui nosso objetivo é olhar
para produtos, de fato.
0:18 - 0:21

Nós não estamos interessados
no perfil dos usuários.
0:21 - 0:23

Não me interessa saber quem está
comprando o quê.
0:23 - 0:27

Eu quero saber qual produto
está relacionado com quais outros.
0:27 - 0:29

Basicamente, nós vamos minerar regras.
0:29 - 0:31

É aqui que aparece o tal do Data Mining.
0:31 - 0:34

Data Mining fica muito evidente
nesse tipo de algoritmo.
0:34 - 0:37

Quando estamos tentando encontrar
relações de produtos
0:37 - 0:41

e vamos verificar se essa relação
procede ou não procede.
0:41 - 0:44

Portanto, a nossa base de dados
deve ser sempre uma transação,
0:44 - 0:46

um histórico de transações de vendas,
por exemplo.
0:46 - 0:48

Eu posso pensar o seguinte.
0:48 - 0:51

Em um mercado,
quais são os produtos
0:51 - 0:53

comprados em conjunto
ao longo do tempo?
0:53 - 0:59

Eu quero minerar regras
de compras similares entre esse histórico.
0:59 - 1:01

Para essa simulação,
vou utilizar uma base de dados disponível
1:01 - 1:07

no Kaggle que está imitando
um histórico de compras no supermercado.
1:07 - 1:09

Então,
aqui já estou na mente do Colab
1:09 - 1:11

com uma instância inicializada.
1:11 - 1:15

Eu já subi a base também aqui
no nosso ambiente
1:15 - 1:17

e vou começar a executar os códigos.
1:17 - 1:20

O primeiro passo é rodar
essa célula que está instalando
1:20 - 1:24

a biblioteca "apyori",
que é uma brincadeira
1:24 - 1:28

com o nome de Python
e o método em si.
1:28 - 1:30

Pronto,
já está instalado aqui nesse ambiente.
1:30 - 1:33

Agora eu posso fazer alguns imports
necessários,
1:33 - 1:35

que é pandas,
numpy para limpeza de dados.
1:35 - 1:39

E de fato, o algoritmo biblioteca
é apyori.
1:39 - 1:42

Aqui vou ler essa base
que está salva como um CSV
1:42 - 1:45

e nesse caso específico,
ela não tem nenhum cabeçalho.
1:45 - 1:48

Não é um CSV tradicional,
digamos assim.
1:48 - 1:53

Tanto que na execução já mostra
como se fosse um dataframe
1:53 - 1:54

com as linhas lidas.
1:54 - 1:57

O que me interessa é linha a linha,
o que foi adquirido.
1:57 - 2:00

Então, nós temos aqui
colunas sem nome,
2:00 - 2:02

porque a coluna "0",
por exemplo,
2:02 - 2:06

contém o primeiro
produto que passou nessa compra.
2:06 - 2:08

A coluna "1",
contém o segundo produto,
2:08 - 2:10

a "2" o terceiro
e por aí vai.
2:10 - 2:13

Então, pode ser que eu compro
apenas um produto
2:13 - 2:16

ou uma sequência
de produtos também.
2:16 - 2:19

Esses "NaN" indicam
esse produto não foi comprado
2:19 - 2:22

ou seja, nem vi o produto em si.
2:22 - 2:26

Mas essa cesta de compras
teve apenas três produtos,
2:26 - 2:28

dois e por aí vai.
2:28 - 2:32

É normal ter uma matriz bem esparsa
nesse tipo de dado,
2:32 - 2:35

portanto temos que prepará-la
para implementar o método.
2:35 - 2:38

Nessa preparação nós temos
que eliminar esse tanto de "NaN".
2:38 - 2:41

Basicamente, nós queremos
criar uma lista de lista, ou seja,
2:41 - 2:45

para cada compra,
cada transação de fato, cada cesta.
2:45 - 2:49

Eu quero criar uma lista
onde apenas produtos comprados
2:49 - 2:51

estejam de fato presentes nessa lista.
2:51 - 2:54

Quem está com valor "NaN"
eu possa ignorá-lo.
2:54 - 2:56

Vou fazer isso
com Python puro mesmo
2:56 - 2:58

a partir do código da próxima célula.
2:58 - 3:01

Então,
aqui embaixo nós temos um código
3:01 - 3:03

que está fazendo o seguinte.
3:03 - 3:04

Basicamente,
nós temos aqui
3:04 - 3:07

uma lista de transações,
uma lista vazia
3:07 - 3:12

e eu vou adicionar nessa lista
uma outra lista.
3:12 - 3:13

Ficando uma lista de listas.
3:13 - 3:16

Onde cada lista
que compõe a lista externa
3:16 - 3:20

ela está analisando os produtos
que foram adquiridos
3:20 - 3:22

e se ele for "NaN" estou ignorando.
3:22 - 3:24

Eu só vou por dentro da lista mesmo
3:24 - 3:27

a palavra que representa
o nome daquele produto.
3:27 - 3:32

Então eu estou percorrendo
o dado da primeira linha até a última,
3:32 - 3:35

criando essa nova representação,
esse novo dado.
3:35 - 3:38

Aqui temos aqui um exemplo
de como ficou.
3:38 - 3:41

Então cada lista dessa
é uma cesta de compras.
3:41 - 3:43

Ela pode ser menor,
maior e por aí vai.
3:43 - 3:47

Notem que me interessa saber
e a relação de um produto com o outro.
3:47 - 3:49

A quantidade não é relevante no caso.
3:49 - 3:51

Então,
saber que existe uma relação,
3:51 - 3:55

por exemplo,
entre frango e ovo
3:55 - 3:56

já é irrelevante para mim.
3:56 - 3:58

Me interessa saber quantos ovos
são associados a compra,
3:58 - 4:01

de quantos quilos de frango,
por exemplo,
4:01 - 4:01

ou vice versa.
4:01 - 4:03

Então,
como a sessão aqui é grande,
4:03 - 4:08

vou lá para baixo para começar
a construir a regra de associação.
4:08 - 4:11

O uso do método "apriori"
é muito direto.
4:11 - 4:15

Basicamente,
ele espera esses "records"
4:15 - 4:16

que são aquela lista de listas,
4:16 - 4:19

a lista dos produtos comprados de fato
4:19 - 4:21

e aqui alguns fatores de parametrização.
4:21 - 4:24

Essa parametrização depende muito
do que a gente quer
4:24 - 4:25

como objetivo de negócio.
4:25 - 4:28

Aqui nós estamos fazendo
a parametrização do método baseado
4:28 - 4:32

em algumas métricas de avaliação
da recomendação, ou seja,
4:32 - 4:34

quero avaliar o poder,
digamos assim,
4:34 - 4:37

daquela associação
de um produto com outro.
4:37 - 4:40

Esse poder está ligado
às métricas de avaliação
4:40 - 4:43

da relação entre um produto e outro.
4:43 - 4:45

Eu posso adicionar métricas
como confiança,
4:45 - 4:48

alavancagem,
entre tantas outras.
4:48 - 4:51

Eu posso limitar inclusive,
o tamanho da regra a ser criada.
4:51 - 4:53

Eu posso limitar,
por exemplo,
4:53 - 4:57

que as regras envolvam
pelo menos dois produtos,
4:57 - 4:59

mas eu posso criar regras
que envolvem pelo menos três,
4:59 - 5:01

quatro,
cinco produtos também.
5:01 - 5:03

No método a priori
não tem certo ou errado,
5:03 - 5:06

nós vamos fazer combinações
de produtos á produtos
5:06 - 5:09

e verificar se existem dados
evidências reais
5:09 - 5:11

que comprovem a eficácia,
eficiência,
5:11 - 5:13

o poder de fato daquela associação.
5:13 - 5:17

Por exemplo,
um lift é uma métrica interessante
5:17 - 5:22

que mostra alavancagem quando eu
tenho um produto que leva a compra do B,
5:22 - 5:26

o quanto que o produto está alavancando
a venda do B.
5:26 - 5:28

Por exemplo, a métrica do suporte.
5:28 - 5:31

Imagine que era verificar uma associação
entre maçã e banana,
5:31 - 5:35

então o suporte dessa regra indica
quantas vezes
5:35 - 5:38

maçãs e bananas
foram compradas em conjunto
5:38 - 5:40

em todo o histórico de transações
que estão analisando,
5:42 - 5:44

e eu posso verificar o suporte mínimo
5:44 - 5:47

assim que eu posso especificar um lift,
uma alavancagem mínima.
5:47 - 5:48

O que isso quer dizer?
5:48 - 5:52

Eu estou minerando as regras
e gerando combinações entre produtos.
5:53 - 5:55

Eu quero ter
5:55 - 5:59

uma regra que tenha no mínimo
uma alavancagem de três, por exemplo.
5:59 - 6:02

Ou seja, essa é produto.
6:02 - 6:06

A compra dele alavanca
a compra do bem em pelo -3 vezes.
6:06 - 6:09

Ou então, supondo nessa associação
6:09 - 6:12

entre produção de maçãs e bananas,
6:12 - 6:17

eu quero ter um suporte mínimo, ou seja,
quero regras que indicam
6:17 - 6:20

que a parte que aparece no histórico
pelo menos número mínimo de vezes.
6:21 - 6:24

Portanto, uma vez configurado
o que a gente quer do ponto de vista de
6:24 - 6:28

regras mínimas, nós podemos rodar aqui
o apriori para fazer essa mineração
6:29 - 6:31

sobre o conjunto de dados
já pré preparado.
6:31 - 6:33

Então rodar o algoritmo
6:34 - 6:35

e veja que ele
6:35 - 6:38

rodou muito rápido,
porque uma base de dados pequena de fato.
6:39 - 6:40

E aqui estou criando uma lista, forçando
6:40 - 6:44

a criação de uma lista da associação
e verificando seu tamanho.
6:44 - 6:47

Foram geradas 24 regras.
6:47 - 6:50

Claro que se tivessem histórico de dados
maior, com mais produtos,
6:50 - 6:53

teriam sido muito mais métricas
serem geradas.
6:53 - 6:56

Ou caso tivessem relaxado essas métricas,
6:56 - 7:00

eu poderia ter regras
um pouco mais fracas, mas mais abundantes.
7:00 - 7:03

Vamos entender a como
que o apriori funciona para
7:03 - 7:05

como que ele gera essas regras.
7:05 - 7:08

Aqui eu posso puxar a primeira regra
gerada por meio
7:08 - 7:11

no seguinte comando Association Round zero
7:11 - 7:15

Olhando a lista de regras,
quero pegar primeiro
7:16 - 7:19

e aqui está mostrando os itens de fato.
7:19 - 7:22

Então é um creme com frango.
7:23 - 7:25

Qual é o item a ser colocado?
7:25 - 7:28

Qual o item que gerou a compra
e posteriormente
7:28 - 7:31

essa regra tem qual lifetime mínimo?
7:32 - 7:35

Qual é a confiança apoiada dessa regra?
7:35 - 7:35

Também?
7:38 - 7:41

Eu posso pegar o seguinte é o segundo item
7:41 - 7:45

dessa composição, dessa regra,
que é de fato a lista de recomendações.
7:45 - 7:48

Então to pegando a lista
Association Rules,
7:48 - 7:52

o primeiro item ou zero e vou pegar agora
a lista de recomendação em si.
7:52 - 7:56

Então o segundo item eu posso pegar aqui
como uma lista de fato.
7:57 - 8:01

E se eu quiser pegar qual o produto
personalizado,
8:01 - 8:04

eu vou fazer uma outra indexação
baseado aqui
8:05 - 8:09

na posição zero dois na zero e novamente.
8:09 - 8:12

Então aqui eu tenho exatamente os produtos
8:12 - 8:13

configurados.
8:13 - 8:17

Note que a saída da regra anterior
é dessa,
8:17 - 8:20

até mesmo porque essa regra aqui
é bem simples tem dois produtos
8:20 - 8:23

apenas, ou seja, nesse ponto
a regra já está melhorada.
8:23 - 8:24

O que tenho que fazer
8:24 - 8:27

é simplesmente passar por essas regras
explorando que regras são essas?
8:27 - 8:30

Construindo aquele motor, digamos assim.
8:30 - 8:32

Quem compra a compra? A parte B.
8:32 - 8:36

A gente pode fazer isso com um laço
que está iterando por essas regras também
8:36 - 8:38

começando na tela.
8:38 - 8:40

As principais métricas
é que regras que foram geradas.
8:40 - 8:41

Vamos ver.
8:41 - 8:44

A próxima tela faz exatamente isso,
8:45 - 8:45

criando aqui.
8:45 - 8:49

Até mesmo o numerador da regra
está aí um, dois, três
8:49 - 8:52

e está separando
uma impressão da outra por uma.
8:53 - 8:57

Uma sequência de 15 iguais,
digamos assim, impressas na tela.
8:57 - 9:00

Então vem naquele isso.
9:03 - 9:06

A primeira regra tem aqui na sexta
9:07 - 9:09

um creme também e frango.
9:09 - 9:13

E a segunda regra temos aqui escalope.
9:13 - 9:16

É uma carne também
com o molho de cogumelo.
9:17 - 9:21

A terceira regra está colocando
a carne também é massa.
9:21 - 9:22

E por aí vai.
9:22 - 9:24

Então nós podemos verificar
quais são os produtos
9:24 - 9:29

que foram comprados em conjunto
às vezes com umas regras pequenas.
9:29 - 9:31

Tá com o tamanho de dois?
9:31 - 9:34

Como nós configuramos
o tamanho mínimo da regra para dois
9:34 - 9:35

envolvendo dois produtos,
9:35 - 9:39

nós temos várias regras que foram criadas
com apenas dois produtos.
9:40 - 9:41

Mas olhando um pouco mais,
9:41 - 9:44

quais dessas regras
que foram impressas com essas 24 criadas?
9:44 - 9:47

Isso em regras um pouco maiores, com três,
com quatro produtos também.
9:48 - 9:51

No entanto, elas são menos
comuns do que regras menores.
9:53 - 9:53

Então, aqui embaixo
9:53 - 9:56

nós temos também um exemplo
com três produtos
9:57 - 10:00

ou com outros seis produtos diferentes
10:00 - 10:02

com outros seis produtos também,
10:02 - 10:05

que pode ser simplesmente
uma combinação entre eles.
10:05 - 10:08

Eu posso tirando um produto
e colocando outro no lugar,
10:09 - 10:12

mas essa base nos permitiu
gerar esse conjunto de regras
10:13 - 10:17

e a pergunta que fica é como é que
nós vamos entregar essas regras?
10:17 - 10:20

Se for, por exemplo, uma loja física,
nós podemos pegar produtos
10:20 - 10:23

que tem uma relação
e colocar próximo dos outros.
10:23 - 10:26

É claro que isso pode não ser viável.
10:26 - 10:32

Por exemplo, eu vou colocar um enlatado
próximo de uma carne que está no açougue.
10:32 - 10:36

Talvez levar uma prateleira do enlatado
para próximo do açougue faz sentido.
10:36 - 10:39

Ao levar a carne
para um outro lugar, pode não ser viável
10:40 - 10:41

agora, no cenário
10:41 - 10:45

digital, quando, por exemplo,
uma compra num e-commerce e nesse mercado,
10:45 - 10:49

ou até mesmo no aplicativo
de relacionamento com os usuários,
10:49 - 10:52

com os clientes dessa loja,
nós podemos verificar
10:52 - 10:54

baseado em qual produto
a pessoa está interagindo,
10:54 - 10:57

colocou na compra, Pode ter algum card
que indica por que não fizeram compra
10:57 - 11:00

também tal produto e esse outro aqui
como nos conta alguma coisa do gênero?
11:01 - 11:05

Assim, o objetivo principal da regra
de associação é achar a associação
11:05 - 11:08

uma relação de produtos
que devem ser combinados.
11:08 - 11:11

A forma como nós vamos entregar
essa inteligência
11:11 - 11:14

que a máquina gerou para a gente
depende muito do negócio
11:14 - 11:18

a ser impactado
e como ele quer implementar essa regra.
11:18 - 11:19

De fato, no mundo real.

Title:: MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI
Video Language:: Portuguese, Brazilian
Duration:: 11:23

	camila00 edited Portuguese, Brazilian subtitles for MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI
	camila00 edited Portuguese, Brazilian subtitles for MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI
	camila00 edited Portuguese, Brazilian subtitles for MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI
	camila00 edited Portuguese, Brazilian subtitles for MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI
	camila00 edited Portuguese, Brazilian subtitles for MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI
	camila00 edited Portuguese, Brazilian subtitles for MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI
	camila00 edited Portuguese, Brazilian subtitles for MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI
	camila00 edited Portuguese, Brazilian subtitles for MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI

Show all

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions

Revision 81 Edited

camila00
Revision 80 Edited

camila00
Revision 79 Edited

camila00
Revision 78 Edited

camila00
Revision 77 Edited

camila00
Revision 76 Edited

camila00
Revision 75 Edited

camila00
Revision 74 Edited

camila00
Revision 73 Edited

camila00
Revision 72 Edited

camila00
Revision 71 Edited

camila00
Revision 70 Edited

camila00
Revision 69 Edited

camila00
Revision 68 Edited

camila00
Revision 67 Edited

camila00
Revision 66 Edited

camila00
Revision 65 Edited

camila00
Revision 64 Edited

camila00
Revision 63 Edited

camila00
Revision 62 Edited

camila00
Revision 61 Edited

camila00
Revision 60 Edited

camila00
Revision 59 Edited

camila00
Revision 58 Edited

camila00
Revision 57 Edited

camila00
Revision 56 Edited

camila00
Revision 55 Edited

camila00
Revision 54 Edited

camila00
Revision 53 Edited

camila00
Revision 52 Edited

camila00
Revision 51 Edited

camila00
Revision 50 Edited

camila00
Revision 49 Edited

camila00
Revision 48 Edited

camila00
Revision 47 Edited

camila00
Revision 46 Edited

camila00
Revision 45 Edited

camila00
Revision 44 Edited

camila00
Revision 43 Edited

camila00
Revision 42 Edited

camila00
Revision 41 Edited

camila00
Revision 40 Edited

camila00
Revision 39 Edited

camila00
Revision 38 Edited

camila00
Revision 37 Edited

camila00
Revision 36 Edited

camila00
Revision 35 Edited

camila00
Revision 34 Edited

camila00
Revision 33 Edited

camila00
Revision 32 Edited

camila00
Revision 31 Edited

camila00
Revision 30 Edited

camila00
Revision 29 Edited

camila00
Revision 28 Edited

camila00
Revision 27 Edited

camila00
Revision 26 Edited

camila00
Revision 25 Edited

camila00
Revision 24 Edited

camila00
Revision 23 Edited

camila00
Revision 22 Edited

camila00
Revision 21 Edited

camila00
Revision 20 Edited

camila00
Revision 19 Edited

camila00
Revision 18 Edited

camila00
Revision 17 Edited

camila00
Revision 16 Edited

camila00
Revision 15 Edited

camila00
Revision 14 Edited

camila00
Revision 13 Edited

camila00
Revision 12 Edited

camila00
Revision 11 Edited

camila00
Revision 10 Edited

camila00
Revision 9 Edited

camila00
Revision 8 Edited

camila00
Revision 7 Edited

camila00
Revision 6 Edited

camila00
Revision 5 Edited

camila00
Revision 4 Edited

camila00
Revision 3 Edited

camila00
Revision 2 Edited

camila00
Revision 1 Uploaded

camila00

	Revision Number	Author	Created
	81	camila00
	80	camila00
	79	camila00
	78	camila00
	77	camila00
	76	camila00
	75	camila00
	74	camila00
	73	camila00
	72	camila00
	71	camila00
	70	camila00
	69	camila00
	68	camila00
	67	camila00
	66	camila00
	65	camila00
	64	camila00
	63	camila00
	62	camila00
	61	camila00
	60	camila00
	59	camila00
	58	camila00
	57	camila00
	56	camila00
	55	camila00
	54	camila00
	53	camila00
	52	camila00
	51	camila00
	50	camila00
	49	camila00
	48	camila00
	47	camila00
	46	camila00
	45	camila00
	44	camila00
	43	camila00
	42	camila00
	41	camila00
	40	camila00
	39	camila00
	38	camila00
	37	camila00
	36	camila00
	35	camila00
	34	camila00
	33	camila00
	32	camila00
	31	camila00
	30	camila00
	29	camila00
	28	camila00
	27	camila00
	26	camila00
	25	camila00
	24	camila00
	23	camila00
	22	camila00
	21	camila00
	20	camila00
	19	camila00
	18	camila00
	17	camila00
	16	camila00
	15	camila00
	14	camila00
	13	camila00
	12	camila00
	11	camila00
	10	camila00
	9	camila00
	8	camila00
	7	camila00
	6	camila00
	5	camila00
	4	camila00
	3	camila00
	2	camila00
	1	camila00

MLM CAP06 2025 VA03 IMPLEMENTACAO DO METODO A PRIORI

Revisions Compare revisions

Our website uses cookies

Operating cookies (Required)