PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA

Rollback to version 61

0:08 - 0:10

Você já se deparou
com algum momento
0:10 - 0:12

em que você acessou o Instagram,
por exemplo,
0:12 - 0:15

e alguns comentários
estavam bloqueados?
0:15 - 0:20

Esse recurso é um recurso que faz
o uso de análise de sentimentos
0:20 - 0:26

para avaliar se existem informações
críticas ou palavras de ódio
0:26 - 0:30

ou alguns xingamentos em relação
a algum tipo de conteúdo.
0:30 - 0:34

Então, a gente pode utilizar AWS
para poder automatizar
0:34 - 0:39

toda essa análise de redes sociais
e facilitar a identificação
0:39 - 0:42

de como que está a aceitação
do nosso produto
0:42 - 0:44

ou da nossa empresa
em relação à comunidade.
0:44 - 0:50

Acessamos agora o console da AWS,
vamos acessar aqui o Sidemaker AI.
0:55 - 0:58

Eu já tenho aqui
uma instância de notebook criado
0:58 - 1:03

que vai servir para criar o nosso
analisador de sentimentos próprio.
1:03 - 1:05

Vou clicar aqui
em "abrir o JupyterLab".
1:11 - 1:13

Já tinha algumas informações abertas.
1:13 - 1:16

Agora a gente vai importar o notebook
que já está pronto
1:16 - 1:18

para a gente fazer
a análise de sentimentos.
1:18 - 1:24

Vou clicar aqui
para fazer o upload de um arquivo.
1:24 - 1:29

Já separei aqui o notebook para vocês
de análise sentimento.
1:29 - 1:33

Vou clicar nele duas vezes
para poder carregar o nosso ambiente.
1:33 - 1:37

Esse notebook foi criado
usando o Python
1:37 - 1:40

e aqui, na primeira célula,
1:40 - 1:42

a gente já importa
algumas bibliotecas necessárias
1:42 - 1:45

para poder fazer
análise de sentimentos.
1:45 - 1:48

A principal delas
é do "sklearn"
1:48 - 1:53

e a "nltk" que lida com a parte
de tokenização dos elementos,
1:53 - 1:56

que é o processo
de quebrar uma sentença
1:56 - 1:59

em várias palavras separadas
para tentar extrair
1:59 - 2:01

algum tipo de informação.
2:01 - 2:04

Então,
assim que carregar o nosso ambiente,
2:04 - 2:06

a gente vai importar
os recursos necessários
2:06 - 2:08

para poder fazer
análises de sentimentos
2:08 - 2:11

em relação aos comentários de filmes,
por exemplo.
2:11 - 2:12

Bom, ele deu esse erro,
2:12 - 2:16

porque a gente ainda não subiu
o arquivo csv que vamos analisar.
2:16 - 2:17

Eu vou subir ele aqui
no nosso ambiente.
2:17 - 2:24

Vou ficar em "upload files",
vou escolher aqui o nosso dataset.
2:24 - 2:29

O dataset é um pouco pesado,
ele tem 63 megas.
2:29 - 2:33

Demora um pouco,
é só aguardar.
2:33 - 2:36

E aqui embaixo a gente vê o status
do carregamento.
2:42 - 2:43

Legal, ele já carregou.
2:43 - 2:45

Vamos explorar aqui esse dataset.
2:45 - 2:48

As primeiras dez linhas
são comentários,
2:48 - 2:50

são reviews
2:50 - 2:52

e o sentimento em relação
a cada um desses reviews.
2:52 - 2:56

Então, a gente usa algo
que já foi classificado, né?
2:56 - 3:01

Alguma pessoa já avaliou
cada review e mostrou o sentimento
3:01 - 3:04

em relação a esse review
como positivo ou negativo.
3:04 - 3:10

E a gente usa isso para poder
treinar o nosso algoritmo.
3:10 - 3:12

Vou visualizar aqui parte dos dados.
3:12 - 3:18

Eu tenho aqui 25 mil reviews
positivos e 25 mil reviews negativos
3:18 - 3:23

e vou usar esses dados
para treinamento.
3:23 - 3:25

Aqui nós temos, por exemplo,
3:25 - 3:28

60% dos dados usados
para treinamento
3:28 - 3:31

e 40% dos dados para teste.
3:31 - 3:34

Mais adiante,
nós temos aqui uma classe
3:34 - 3:37

para poder fazer
toda a limpeza dos dados
3:37 - 3:43

para poder remover conteúdo HTML,
remover conteúdo entre colchetes,
3:43 - 3:48

caracteres especiais,
palavras de parada como ponto,
3:48 - 3:50

ponto e virgula, hífen.
3:50 - 3:53

Fazer o processo
conhecido como stemming,
3:53 - 3:59

que é um processo de transformar
a palavra no seu radical.
3:59 - 4:01

E aí a gente
usa uma função agregadora
4:01 - 4:03

chamada "clean_test",
4:03 - 4:07

que vai usar todas
essas outras funções de uma vez só.
4:07 - 4:11

Finalmente,
a gente vai ajustar o modelo
4:11 - 4:12

e fazer a transformação dos dados
4:12 - 4:17

para poder fazer todo esse
processo de tokenização
4:17 - 4:20

e transformação dos dados.
4:20 - 4:25

Tudo isso está dentro de uma classe
chamada "TestCleaner",
4:25 - 4:29

que é para fazer a limpeza dos dados.
4:29 - 4:32

Antes de fazer a limpeza,
a gente pode ver, por exemplo,
4:32 - 4:35

que parte dos textos
tem caracteres especiais
4:35 - 4:37

ou tem algumas marcações em HTML.
4:37 - 4:39

Então, a gente precisa
tirar esses textos
4:39 - 4:45

para a gente conseguir treinar
melhor o nosso modelo.
4:45 - 4:47

Aqui embaixo,
a gente vai criar um pipeline,
4:47 - 4:52

que é uma sequência de etapas
que vai fazer de forma integrada.
4:52 - 4:54

Primeiro,
a limpeza dos dados.
4:54 - 4:57

Depois, ele faz o processo
conhecido como vetorização,
4:57 - 5:02

que ele vai tokenizar,
transformar uma sentença
5:02 - 5:06

em várias palavras e contar
a frequência dessas palavras.
5:06 - 5:07

E, por último,
5:07 - 5:09

a gente vai usar
o modelo de machine learning,
5:09 - 5:11

que é a regressão logística,
5:11 - 5:14

para poder utilizar
essas informações de entrada
5:14 - 5:20

para avaliar novos textos,
se eles são positivos ou negativos.
5:20 - 5:22

Então, pipeline é só uma sequência
de etapas.
5:22 - 5:29

Aí sim, eu vou treinar esse
modelo usando esse pipeline.
5:29 - 5:32

Esse processo demora
cerca de 3 a 5 minutos,
5:32 - 5:36

então, vamos aguardar enquanto
ele faz o treinamento do modelo.
5:36 - 5:37

No nosso caso,
5:37 - 5:39

depois que a gente mandou
treinar aquele modelo,
5:39 - 5:40

ele deu um "time out".
5:40 - 5:44

Então a gente precisou redimensionar
a nossa massa de dados de treino
5:44 - 5:49

para uma massa de dados menor
para que ele conseguisse processar.
5:49 - 5:51

Como que a gente fez isso?
5:51 - 5:57

A gente foi lá na célula
dois ou três.
5:57 - 6:00

Aqui a nossa célula seis.
6:00 - 6:04

Aqui a gente redimensionou em vez
de treinar com 60% dos dados,
6:04 - 6:08

eu coloquei aqui para treinar
com 40% dos dados,
6:08 - 6:12

20.000 itens,
20.000 linhas
6:12 - 6:15

e aí,
o restante fica para testes.
6:15 - 6:18

Após isso,
nós mandamos processar novamente
6:18 - 6:22

e finalmente ele treinou aqui
o nosso modelo,
6:22 - 6:26

ajustando os dados e aprendendo
com essa massa de dados de teste
6:26 - 6:28

Aqui quando ele faz o treinamento,
6:28 - 6:30

ele já mostra para a gente também
o pipeline.
6:30 - 6:31

O que é o pipeline?
6:31 - 6:34

Aquela sequência de etapas
que ele executou no texto.
6:34 - 6:37

Primeiro ele fez
a limpagem dos textos.
6:37 - 6:41

Ele excluiu informações não
relevantes para análise de texto.
6:41 - 6:46

A contagem e vetorização,
ele cria vários tokens
6:46 - 6:49

ele separa as palavras,
faz uma contagem
6:49 - 6:51

e essas palavras são utilizadas
para alimentar
6:51 - 6:53

o modelo de regressão logística.
6:53 - 6:56

E finalmente,
a gente pode aferir
6:56 - 7:02

a acurácia do nosso modelo
que a gente vai executar agora.
7:02 - 7:03

Legal,
7:03 - 7:06

depois de alguns minutos
ele processou aqui
7:06 - 7:07

O que ele fez?
7:07 - 7:14

Ele usou o modelo treinado
e executou sobre os dados de teste.
7:14 - 7:21

E ele acertou 88% dos dados de teste
em relação ao sentimento aferido,
7:21 - 7:22

se positivo ou não.
7:22 - 7:23

O que a gente vai fazer agora?
7:23 - 7:26

A gente vai pegar um novo texto
e vamos pedir para ele avaliar
7:26 - 7:31

se o sentimento é positivo
ou negativo.
7:31 - 7:36

Então coloquei aqui
uma review em inglês.
7:36 - 7:40

A primeira é uma review positiva
7:40 - 7:43

e aí eu vou tentar fazer
uma análise de sentimento
7:43 - 7:45

em relação a essa review.
7:45 - 7:49

Então a gente usou o nosso pipeline
que a gente já deixou pronto,
7:49 - 7:53

ele vai pegar todo esse texto,
vai tokenizar,
7:53 - 7:57

vai separar as palavras,
eliminar as palavras de ligação
7:57 - 7:59

e vai avaliar com as palavras
que sobraram
7:59 - 8:02

se é um sentimento positivo
ou negativo.
8:02 - 8:04

Então,
para essa review específica,
8:04 - 8:08

ele verificou aqui
como um sentimento positivo,
8:08 - 8:13

que é o que a gente
espera que ele faça a análise.
8:13 - 8:16

Então, nesse caso,
nós vimos o modelo completo
8:16 - 8:21

de análise de sentimentos usando
o ambiente do Sagemaker A.I.
8:21 - 8:23

Antes da gente encerrar,
a gente precisa excluir
8:23 - 8:26

a nossa instância do notebook
para que a gente evite cobranças.
8:26 - 8:28

Ela está no ar,
enquanto ela está no ar,
8:28 - 8:31

a AWS vai incidir cobrança
para a gente.
8:31 - 8:37

Então, vou voltar aqui,
vou sair do Júpiter Lab.
8:37 - 8:40

Voltei aqui para o ambiente
do Sagemaker A.I.
8:40 - 8:43

Vou selecionar a instância
e vou primeiro
8:43 - 8:45

interromper a instância.
8:45 - 8:46

Depois de alguns instantes,
8:46 - 8:48

ele vai interromper aqui
o nosso serviço.
8:48 - 8:53

Aí eu posso finalmente excluir
a nossa instância de notebooks.
8:53 - 8:58

Vou aplicar aqui em "excluir".
8:58 - 9:01

E aí, já não vai incidir nenhum custo
9:01 - 9:04

em relação ao uso dessa instância
do Sagemaker A.I.
9:04 - 9:07

Então nós vimos como a gente
pode usar o Sidemaker A.I
9:07 - 9:09

para criar uma solução completa
de machine learning,
9:09 - 9:11

por exemplo,
como análise de sentimentos.
9:11 - 9:14

Quando a gente cria uma solução
usando machine learning,
9:14 - 9:16

é um processo interativo.
9:16 - 9:19

Você precisa testar,
avalia as métricas
9:19 - 9:21

e depois você modifica o seu código
9:21 - 9:23

para avaliar se está de acordo
com o que você espera,
9:23 - 9:25

que foi o que a gente fez.
9:25 - 9:27

Em alguns momentos,
pode dar algum timeout
9:27 - 9:30

a gente reprocessa,
reavalia os dados de treino,
9:30 - 9:33

reavalia os dados de testes
e executa novamente.
9:33 - 9:37

Então, com isso,
a gente consegue ampliar
9:37 - 9:40

a forma como a gente usa
os modelos de machine learning
9:40 - 9:44

no ambiente seguro da AWS,
no ambiente dentro do Sidemaker A.I.

Title:: PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA
Video Language:: Portuguese, Brazilian
Duration:: 09:48

	camila00 edited Portuguese, Brazilian subtitles for PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA
	camila00 edited Portuguese, Brazilian subtitles for PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA
	camila00 edited Portuguese, Brazilian subtitles for PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA
	camila00 edited Portuguese, Brazilian subtitles for PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA
	camila00 edited Portuguese, Brazilian subtitles for PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA
	camila00 edited Portuguese, Brazilian subtitles for PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA
	camila00 edited Portuguese, Brazilian subtitles for PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA
	camila00 edited Portuguese, Brazilian subtitles for PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA

Show all

Portuguese, Brazilian subtitles

Incomplete

Revisions Compare revisions

Revision 70 Edited

camila00
Revision 69 Edited

camila00
Revision 68 Edited

camila00
Revision 67 Edited

camila00
Revision 66 Edited

camila00
Revision 65 Edited

camila00
Revision 64 Edited

camila00
Revision 63 Edited

camila00
Revision 62 Edited

camila00
Revision 61 Edited

camila00
Revision 60 Edited

camila00
Revision 59 Edited

camila00
Revision 58 Edited

camila00
Revision 57 Edited

camila00
Revision 56 Edited

camila00
Revision 55 Edited

camila00
Revision 54 Edited

camila00
Revision 53 Edited

camila00
Revision 52 Edited

camila00
Revision 51 Edited

camila00
Revision 50 Edited

camila00
Revision 49 Edited

camila00
Revision 48 Edited

camila00
Revision 47 Edited

camila00
Revision 46 Edited

camila00
Revision 45 Edited

camila00
Revision 44 Edited

camila00
Revision 43 Edited

camila00
Revision 42 Edited

camila00
Revision 41 Edited

camila00
Revision 40 Edited

camila00
Revision 39 Edited

camila00
Revision 38 Edited

camila00
Revision 37 Edited

camila00
Revision 36 Edited

camila00
Revision 35 Edited

camila00
Revision 34 Edited

camila00
Revision 33 Edited

camila00
Revision 32 Edited

camila00
Revision 31 Edited

camila00
Revision 30 Edited

camila00
Revision 29 Edited

camila00
Revision 28 Edited

camila00
Revision 27 Edited

camila00
Revision 26 Edited

camila00
Revision 25 Edited

camila00
Revision 24 Edited

camila00
Revision 23 Edited

camila00
Revision 22 Edited

camila00
Revision 21 Edited

camila00
Revision 20 Edited

camila00
Revision 19 Edited

camila00
Revision 18 Edited

camila00
Revision 17 Edited

camila00
Revision 16 Edited

camila00
Revision 15 Edited

camila00
Revision 14 Edited

camila00
Revision 13 Edited

camila00
Revision 12 Edited

camila00
Revision 11 Edited

camila00
Revision 10 Edited

camila00
Revision 9 Edited

camila00
Revision 8 Edited

camila00
Revision 7 Edited

camila00
Revision 6 Edited

camila00
Revision 5 Edited

camila00
Revision 4 Edited

camila00
Revision 3 Edited

camila00
Revision 2 Edited

camila00
Revision 1 Uploaded

camila00

	Revision Number	Author	Created
	70	camila00
	69	camila00
	68	camila00
	67	camila00
	66	camila00
	65	camila00
	64	camila00
	63	camila00
	62	camila00
	61	camila00
	60	camila00
	59	camila00
	58	camila00
	57	camila00
	56	camila00
	55	camila00
	54	camila00
	53	camila00
	52	camila00
	51	camila00
	50	camila00
	49	camila00
	48	camila00
	47	camila00
	46	camila00
	45	camila00
	44	camila00
	43	camila00
	42	camila00
	41	camila00
	40	camila00
	39	camila00
	38	camila00
	37	camila00
	36	camila00
	35	camila00
	34	camila00
	33	camila00
	32	camila00
	31	camila00
	30	camila00
	29	camila00
	28	camila00
	27	camila00
	26	camila00
	25	camila00
	24	camila00
	23	camila00
	22	camila00
	21	camila00
	20	camila00
	19	camila00
	18	camila00
	17	camila00
	16	camila00
	15	camila00
	14	camila00
	13	camila00
	12	camila00
	11	camila00
	10	camila00
	9	camila00
	8	camila00
	7	camila00
	6	camila00
	5	camila00
	4	camila00
	3	camila00
	2	camila00
	1	camila00

PSCC CAP06 2025 VA03 ANALISE DE SENTIMENTOS CUSTOMIZADA

Revisions Compare revisions

Our website uses cookies

Operating cookies (Required)