WEBVTT 00:00:07.810 --> 00:00:10.083 Agora que você já teve um overview, 00:00:10.083 --> 00:00:13.513 já entendeu o funcionamento geral da ferramenta Gephi. 00:00:13.513 --> 00:00:16.282 A gente vai partir para um exercício prático 00:00:16.282 --> 00:00:19.539 para criar esse exercício prático, 00:00:19.539 --> 00:00:22.555 a gente vai utilizar uma base de dados 00:00:22.555 --> 00:00:25.393 que considera o nome de algumas pessoas, 00:00:25.393 --> 00:00:27.393 algumas características sobre elas. 00:00:27.393 --> 00:00:30.744 Então, qual é o gênero? Qual é a idade? 00:00:30.744 --> 00:00:34.000 E quais são as duas frutas preferidas? 00:00:34.000 --> 00:00:36.569 O primeiro sabor e o segundo sabor? 00:00:36.569 --> 00:00:39.973 Dessa forma, a gente vai ter duas tabelas, 00:00:39.973 --> 00:00:42.627 então, uma tabela que vai ser a tabela de nós 00:00:42.627 --> 00:00:44.677 e uma outra tabela de arestas. 00:00:44.677 --> 00:00:48.548 E a partir dessas duas tabelas a gente vai fazer o exercício para criar 00:00:48.548 --> 00:00:53.987 tanto a partir de uma aresta, o nosso Network Graph. 00:00:53.987 --> 00:00:56.788 E a gente vai criar também um outro exercício 00:00:56.788 --> 00:00:58.958 a partir da tabela de nós. 00:00:58.958 --> 00:01:01.019 Dessa forma, vai ficar muito mais prático 00:01:01.019 --> 00:01:05.377 para vocês conseguirem entender o funcionamento da ferramenta 00:01:05.377 --> 00:01:07.540 na criação de Network Graph. 00:01:07.540 --> 00:01:09.847 Então aqui na tela, abrindo a ferramenta, 00:01:09.847 --> 00:01:13.303 a primeira visualização que a gente tem é aquela tela geral 00:01:13.303 --> 00:01:14.974 que vocês já viram. 00:01:14.974 --> 00:01:17.022 Então, a primeira coisa que a gente tem que fazer 00:01:17.022 --> 00:01:19.702 é entrar aqui em "Arquivo". 00:01:19.702 --> 00:01:24.250 Depois a gente tem que clicar aqui em "novo projeto". 00:01:24.250 --> 00:01:28.187 Então a gente vai criar ali o nosso novo projeto. 00:01:28.187 --> 00:01:29.889 Aqui no novo projeto, 00:01:29.889 --> 00:01:32.458 já para deixar salvo e a gente não perder esse arquivo 00:01:32.458 --> 00:01:36.529 caso aconteça algum problema, a gente clique em "Salvar como". 00:01:36.529 --> 00:01:38.061 E aí é legal a gente colocar o nome 00:01:38.061 --> 00:01:40.342 que a gente vai conseguir visualizar depois 00:01:40.342 --> 00:01:42.657 eu vou colocar o nome de "rede". 00:01:42.657 --> 00:01:46.321 E a gente precisa alterar ao invés de deixar aqui todos os arquivos, 00:01:46.321 --> 00:01:51.544 a gente altera para "Arquivos Gephi" e depois "Salvar". 00:01:51.544 --> 00:01:55.648 Então pronto, agora a gente já tem o nosso projeto "rede" salvo. 00:01:55.648 --> 00:01:57.658 A gente vai fazer dois exercícios. 00:01:57.658 --> 00:02:02.068 Então, o primeiro deles a gente vai subir um arquivo de arestas 00:02:02.068 --> 00:02:05.291 que a gente já tem ele aqui salvo, ele pronto. 00:02:05.291 --> 00:02:08.728 Então, para importar esse arquivo de arestas, 00:02:08.728 --> 00:02:12.899 a gente precisa vir aqui em "laboratório de dados". 00:02:12.899 --> 00:02:16.843 Depois muda aqui para essa aba de "arestas". 00:02:16.843 --> 00:02:18.638 "Importar planilha". 00:02:18.638 --> 00:02:19.940 Aqui no "Importar Planilha" 00:02:19.940 --> 00:02:23.810 eu preciso encontrar o meu arquivo de "arestas" 00:02:23.810 --> 00:02:26.846 que vai estar salvo aqui como "arestas". 00:02:26.846 --> 00:02:31.450 Lembrando que tem que ser um arquivo csv para o Gephi conseguir ler. 00:02:31.450 --> 00:02:36.355 depois que a gente clicar aqui em "arestas" a gente clica em "abrir". 00:02:36.355 --> 00:02:40.927 Agora o Gephi já mostra para você o que tem no seu arquivo. 00:02:40.927 --> 00:02:43.830 Ele está te mostrando já que é um arquivo csv. 00:02:43.830 --> 00:02:47.208 Ele mostra aqui o local, mostra como que ele está separando 00:02:47.208 --> 00:02:48.568 os dados desse arquivo. 00:02:48.568 --> 00:02:51.604 Então você vê que está separando por vírgula. 00:02:51.604 --> 00:02:55.908 E já está te falando que é um arquivo aqui de arestas 00:02:55.908 --> 00:02:59.312 e você mantém aqui a formatação que é o UTF8. 00:02:59.312 --> 00:03:04.550 para ele considerar a formatação toda certa aqui dos indicadores. 00:03:04.550 --> 00:03:07.186 Depois a gente tem que clicar em "próximo". 00:03:07.186 --> 00:03:10.590 Aqui no "próximo" a gente pode manter do jeito que está. 00:03:10.590 --> 00:03:13.659 Uma opção que você tem é aqui no "Weight" 00:03:13.659 --> 00:03:17.830 você alterar para "float" para indicar que é um número, 00:03:17.830 --> 00:03:20.499 mas se deixar em "Double", ele vai funcionar também. 00:03:20.499 --> 00:03:22.969 Depois vai clicar em "finalizar". 00:03:22.969 --> 00:03:25.071 Agora que você clicou em finalizar, 00:03:25.071 --> 00:03:27.974 você mantém aqui como "não dirigido". 00:03:27.974 --> 00:03:29.607 E no caso do nosso relatório, 00:03:29.607 --> 00:03:31.867 que a gente está criando pela primeira vez, 00:03:31.867 --> 00:03:34.346 a gente pode deixar "New workspace" 00:03:34.346 --> 00:03:36.706 e depois, "ok". 00:03:36.706 --> 00:03:40.286 Agora que a gente importou o nosso arquivo de arestas, 00:03:40.286 --> 00:03:42.975 você vai visualizar aqui na tela que a gente já tem 00:03:42.975 --> 00:03:46.659 a nossa tabela de dados com as arestas. 00:03:46.659 --> 00:03:49.328 Agora, no exercício que a gente está fazendo, 00:03:49.328 --> 00:03:52.498 o próprio arquivo vai criar a tabela de nós. 00:03:52.498 --> 00:03:54.515 Então, a gente não precisou importar. 00:03:54.515 --> 00:03:56.635 Se a gente vem aqui na aba de nós, 00:03:56.635 --> 00:04:00.039 está vendo que ele já tem aqui algumas informações? 00:04:00.039 --> 00:04:02.777 Então, através da tabela de arestas, 00:04:02.777 --> 00:04:07.087 ele considerou que a nossa origem, que era o nome lá das pessoas 00:04:07.087 --> 00:04:12.618 e o sabor preferido de fruta delas e ele já criou aqui nós. 00:04:12.618 --> 00:04:15.621 Agora, para a gente visualizar o grafo já criado, 00:04:15.621 --> 00:04:19.959 o nosso Network Graph, a gente vem aqui em "visão geral" 00:04:19.959 --> 00:04:22.628 e você vai visualizar que ele já aparece aqui. 00:04:22.628 --> 00:04:26.374 Então aqui, a gente já criou um primeiro Network Graph 00:04:26.374 --> 00:04:28.968 e o que a gente pode fazer agora? 00:04:28.968 --> 00:04:34.231 Como ele criou ali o cálculo todo, a configuração dos nós, 00:04:34.231 --> 00:04:36.308 ele criou automaticamente. 00:04:36.308 --> 00:04:39.578 Eu posso criar algumas estatísticas em cima disso, 00:04:39.578 --> 00:04:41.647 eu posso criar alguns cálculos. 00:04:41.647 --> 00:04:43.959 Então, uma opção que a gente tem é fazer isso. 00:04:43.959 --> 00:04:47.119 Eu venho aqui na aba "Estatísticas" 00:04:47.119 --> 00:04:49.788 e aqui eu vou executar os cálculos que eu quiser. 00:04:49.788 --> 00:04:52.450 Então, eu posso calcular, por exemplo, 00:04:52.450 --> 00:04:58.887 uma análise estatística inferencial e eu posso clicar aqui em "executar", 00:04:58.887 --> 00:05:02.154 você vai ver que ele sempre vai te trazer o resultado 00:05:02.154 --> 00:05:06.839 que aí você pode enxergar aqui qual foi o algoritmo utilizado 00:05:06.839 --> 00:05:11.210 qual foi a metodologia que ele utilizou para criar aquele cálculo. 00:05:11.210 --> 00:05:13.521 E aí você pode fechar você tem como salvar, 00:05:13.521 --> 00:05:15.481 imprimir e tudo mais. 00:05:15.481 --> 00:05:18.117 E você pode ir executando outros cálculos. 00:05:18.117 --> 00:05:22.087 Eu posso fazer um cálculo aqui de coeficiente de clusterização 00:05:22.087 --> 00:05:25.619 coloco aqui em "executar", do um "ok", 00:05:25.619 --> 00:05:26.659 aí ele faz a mesma coisa, 00:05:26.659 --> 00:05:31.280 ele te traz aqui a visualização desse coeficiente. 00:05:31.280 --> 00:05:33.024 E agora, o que acontece? 00:05:33.024 --> 00:05:35.234 Quando a gente faz esses cálculos estatísticos, 00:05:35.234 --> 00:05:38.205 ele vai acrescentando essas colunas com os cálculos 00:05:38.205 --> 00:05:39.705 na nossa tabela de dados. 00:05:39.705 --> 00:05:42.074 Então, vamos visualizar como que esse ficou. 00:05:42.074 --> 00:05:44.009 Eu venho aqui em "laboratório de dados", 00:05:44.009 --> 00:05:46.979 aí você vai ver que ele vai aqui em "arestas". 00:05:46.979 --> 00:05:49.880 Ele vai trazendo os cálculos que a gente criar. 00:05:49.880 --> 00:05:51.250 Opa, aqui em "nós". 00:05:51.250 --> 00:05:54.934 Então ele vai te trazer o clustering de coeficiente, 00:05:54.934 --> 00:05:57.656 vai te trazer a inferência. 00:05:57.656 --> 00:05:59.917 Aqui como ele está com poucas casas decimais 00:05:59.917 --> 00:06:01.527 aí está mostrando tudo zerado. 00:06:01.527 --> 00:06:04.196 Mas a tendência é que quando ele faz o cálculo, 00:06:04.196 --> 00:06:07.166 ele traga o valor certo aqui. 00:06:07.166 --> 00:06:09.134 Então, está funcionando direito. 00:06:09.134 --> 00:06:11.196 Aí aqui em "arestas" não acontece nada, 00:06:11.196 --> 00:06:13.906 porque o cálculo está lá em "nós". 00:06:13.906 --> 00:06:15.618 E voltando aqui para "visão geral", 00:06:15.618 --> 00:06:19.015 a gente tem a visão aqui do nosso Network Graph. 00:06:19.015 --> 00:06:22.237 Uma opção que a gente tem é se a gente quiser visualizar 00:06:22.237 --> 00:06:23.448 o rótulo de dados, 00:06:23.448 --> 00:06:25.717 porque agora o gráfico está limpo, né? 00:06:25.717 --> 00:06:30.222 Não tem nada. Eu posso clicar aqui nesse "T". 00:06:30.222 --> 00:06:34.760 E aí, ele vai habilitar o nosso label, nosso rótulo de dados. 00:06:34.760 --> 00:06:36.466 Para funcionar direito, 00:06:36.466 --> 00:06:38.986 eu preciso quando você passar o mouse aqui 00:06:38.986 --> 00:06:42.158 ele vai te falar que ele está te mostrando o rótulo dos nós. 00:06:42.158 --> 00:06:46.477 Mas se a gente voltar na nossa base de dados aqui em nós, 00:06:46.477 --> 00:06:49.064 a única informação que ele tem é o ID. 00:06:49.064 --> 00:06:51.585 Lá provavelmente ele está considerando label, 00:06:51.585 --> 00:06:53.345 por isso que não está mostrando nada. 00:06:53.345 --> 00:06:57.516 Então a gente tem como controlar isso para ele mostrar corretamente. 00:06:57.516 --> 00:06:59.832 Então eu venho aqui para ele mostrar as arestas, 00:06:59.832 --> 00:07:06.067 só que eu clico aqui na "configuração" e aí eu coloco aqui em "nós" o ID, 00:07:06.067 --> 00:07:09.895 e aí se eu dou um "ok", está vendo que ele agora aparece? 00:07:09.895 --> 00:07:13.965 Então com a configuração que estava ele estava mostrando só o label, 00:07:13.965 --> 00:07:16.768 e aí como estava em branco ele não estava trazendo nada, 00:07:16.768 --> 00:07:19.905 mas dessa forma ele já te mostra ali os rótulos. 00:07:19.905 --> 00:07:22.852 Se eu quiser ver também os rótulos das arestas, 00:07:22.852 --> 00:07:26.183 eu posso clicar nesse "T" aqui e aí a mesma coisa 00:07:26.183 --> 00:07:29.140 se ele não estiver mostrando é porque ele está considerando o label 00:07:29.140 --> 00:07:31.397 e aí eu posso vir aqui em "arestas", 00:07:31.397 --> 00:07:36.755 "ID" ou posso selecionar as outras informações que ele exibe também. 00:07:36.755 --> 00:07:38.381 Aí você vai visualizar o que ele está mostrando aqui, 00:07:38.381 --> 00:07:39.891 mas bem pequeno, 00:07:39.891 --> 00:07:43.167 mas já dá para visualizar que ele está ativo. 00:07:43.167 --> 00:07:45.397 Agora a gente vai para o segundo exercício. 00:07:45.397 --> 00:07:47.343 A diferença desse para o anterior 00:07:47.343 --> 00:07:50.729 é que, ao invés da gente importar uma tabela de arestas, 00:07:50.729 --> 00:07:54.339 agora a gente vai partir pela tabela de nós 00:07:54.339 --> 00:07:56.641 e depois que a gente importar a tabela de nós 00:07:56.641 --> 00:07:58.715 que a gente vai importar a tabela de arestas, 00:07:58.715 --> 00:08:00.117 vamos fazer agora. 00:08:00.117 --> 00:08:04.444 Então, voltando aqui para o nosso projeto , 00:08:04.444 --> 00:08:05.699 o que a gente vai fazer? 00:08:05.699 --> 00:08:09.488 A gente vai clicar aqui no "laboratório de dados", 00:08:09.488 --> 00:08:13.146 vou entrar aqui em "nós", na verdade, 00:08:13.146 --> 00:08:15.146 até para não atrapalhar, 00:08:15.146 --> 00:08:17.662 vou voltar para essa área de trabalho que está vazia. 00:08:17.662 --> 00:08:22.400 Então vem em "nós", clico aqui "Importar planilha" 00:08:22.400 --> 00:08:25.752 e aí eu vou procurar a minha tabela de "nós". 00:08:25.752 --> 00:08:29.453 Então procuro ela aqui, aqui está salva como "nós" 00:08:29.453 --> 00:08:33.059 é um csv também, do mesmo jeito que as arestas. 00:08:33.059 --> 00:08:37.515 Aí nesse daqui mesma coisa, ele vai te mostrar a separação, 00:08:37.515 --> 00:08:39.851 então você tem que confirmar né? 00:08:39.851 --> 00:08:43.488 Se ele está separando por vírgula porque é um arquivo csv, 00:08:43.488 --> 00:08:45.461 se é uma tabela de nós 00:08:45.461 --> 00:08:49.661 e se está com a configuração correta de UTF8. 00:08:49.661 --> 00:08:51.429 Depois eu venho em "próximo". 00:08:51.429 --> 00:08:52.893 Tenho que confirmar também, 00:08:52.893 --> 00:08:56.093 se os meus campos estão descritos da forma correta, 00:08:56.093 --> 00:08:59.704 então nós tem que ser um texto, por isso que está string aqui 00:08:59.771 --> 00:09:04.609 e o que for número eu tenho que confirmar também está número, que é o caso aqui 00:09:04.609 --> 00:09:09.581 de idade, então idade é um número inteiro, por isso que ele está aqui como Integer. 00:09:09.648 --> 00:09:12.350 Depois eu clico em finalizar 00:09:12.450 --> 00:09:12.684 aqui. 00:09:12.684 --> 00:09:16.988 No finalizar eu preciso só fazer uma alteração no tipo de grafo 00:09:16.988 --> 00:09:20.792 ao invés de misturado, eu tenho que colocar como não dirigido 00:09:20.859 --> 00:09:25.263 e aí pra ele não criar um novo espaço eu posso colocar aqui um apêndice 00:09:25.330 --> 00:09:30.034 que eu sei que existem workspace que ele vai considerar na mesma pasta de trabalho 00:09:30.101 --> 00:09:32.704 e aí eu dou um ok, 00:09:32.704 --> 00:09:35.707 agora que eu fiz esse OK, você vai ver que a tabela de nós 00:09:35.707 --> 00:09:40.111 está criada ali, do mesmo jeitinho que estava o nosso arquivo 00:09:40.178 --> 00:09:42.647 e a tabela de arestas está em branca. 00:09:42.647 --> 00:09:45.550 Então eu tenho aqui nós e nesse caso, 00:09:45.550 --> 00:09:48.553 como eu partida da tabela de nós, 00:09:48.586 --> 00:09:51.556 eu preciso incluir agora as arestas. 00:09:51.556 --> 00:09:57.529 Então agora eu vou aqui para tabela de arestas e vou clicar em Importar Planilha 00:09:57.629 --> 00:09:59.631 aqui no Importar Planilha. 00:09:59.631 --> 00:10:01.533 A mesma coisa que a gente fez no anterior 00:10:01.533 --> 00:10:05.069 e vou procurar aqui a minha tabela de arestas. 00:10:05.170 --> 00:10:07.839 Então arestas, ponto. CSV. 00:10:07.839 --> 00:10:11.509 Tá tudo aqui separando por vírgula 00:10:11.576 --> 00:10:14.812 certinho e tá falando que é uma tabela de arestas. 00:10:14.913 --> 00:10:17.649 Vou aqui no próximo aí a mesma coisa. 00:10:17.649 --> 00:10:22.320 Eu posso deixar o what aqui como double ou eu posso mudar ele para fora, que aí 00:10:22.320 --> 00:10:27.792 ele vai considerar o número decimal e finalizar aqui no finalizar 00:10:27.859 --> 00:10:29.327 não dirigido também. 00:10:29.327 --> 00:10:31.629 E eu coloco o Apêndice II que tem workspace 00:10:31.629 --> 00:10:34.132 porque ele vai juntar com os nós. 00:10:34.132 --> 00:10:36.367 Aí dou um ok. 00:10:36.367 --> 00:10:39.370 Pronto, agora que eu dei o OK, eu tenho a tabela de nós 00:10:39.370 --> 00:10:43.942 do jeito que a gente importou e eu tenho a tabela de arestas. 00:10:44.042 --> 00:10:48.313 Então aqui a gente consegue visualizar que a gente que configurou tudo, né? 00:10:48.346 --> 00:10:51.849 Então eu fiz a tabela de nós e fiz a tabela de arestas. 00:10:51.916 --> 00:10:54.719 Depois volto aqui para Visão Geral e a gente 00:10:54.719 --> 00:10:58.523 consegue visualizar que o nosso novo Network Graph. 00:10:58.623 --> 00:11:02.360 E aí para funcionar a questão dos rótulos vai ser a mesma coisa. 00:11:02.360 --> 00:11:08.766 Eu posso clicar aqui no desenho de label aqui para a gente olhar o Node 00:11:08.833 --> 00:11:12.403 e aí ele vai habilitar e eu posso clicar no desenho 00:11:12.403 --> 00:11:16.674 aqui de arestas e ele vai habilitar também as arestas, bem pequenininho ali. 00:11:16.774 --> 00:11:20.311 E se eu quiser configurar o que vai aparecer nas arestas, 00:11:20.311 --> 00:11:21.813 aí eu posso selecionar. 00:11:21.813 --> 00:11:25.416 Então, por exemplo, aqui ele estava considerando label, mas eu posso pegar, 00:11:25.416 --> 00:11:29.320 por exemplo, a fruta, furtar um, fruta dois, posso pegar a idade. 00:11:29.320 --> 00:11:33.724 Aí eu vou selecionando o que eu quero que apareça no meu network iguais. 00:11:33.791 --> 00:11:38.596 Claro que, como você vai analisar, você precisa escolher exatamente ali 00:11:38.596 --> 00:11:42.867 o que que vai fazer mais sentido nessa sua visão. 00:11:42.967 --> 00:11:47.605 Agora que você já importou a tabela de nós e a tabela de arestas, 00:11:47.605 --> 00:11:53.144 você consegue analisar o seu Network Graph e entendendo o relacionamento 00:11:53.144 --> 00:11:56.914 entre os seus nós e as suas arestas e criando essas análises, 00:11:56.914 --> 00:11:58.983 você pode usar a parte estatística aqui 00:11:58.983 --> 00:12:01.986 para fazer alguns cálculos que nem a gente fez no anterior. 00:12:02.153 --> 00:12:05.656 E aí, dessa forma, você já seguiu o passo a passo 00:12:05.656 --> 00:12:08.659 e conseguiu criar o seu primeiro Network Graph. 00:12:08.860 --> 00:12:11.562 Você sabe que eu já fiz uma ferramenta que você pode contar 00:12:11.562 --> 00:12:15.633 para esse tipo de criação visual e pode te ajudar nas suas análises. 00:12:15.633 --> 00:12:19.670 Então siga esses passos, utiliza seus arquivos 00:12:19.670 --> 00:12:24.442 e você vai conseguir entender muito melhor o relacionamento entre os seus dados e.