1 00:00:07,810 --> 00:00:10,083 Agora que você já teve um overview, 2 00:00:10,083 --> 00:00:13,513 já entendeu o funcionamento geral da ferramenta Gephi. 3 00:00:13,513 --> 00:00:16,282 A gente vai partir para um exercício prático 4 00:00:16,282 --> 00:00:19,539 para criar esse exercício prático, 5 00:00:19,539 --> 00:00:22,555 a gente vai utilizar uma base de dados 6 00:00:22,555 --> 00:00:25,393 que considera o nome de algumas pessoas, 7 00:00:25,393 --> 00:00:27,393 algumas características sobre elas. 8 00:00:27,393 --> 00:00:30,744 Então, qual é o gênero? Qual é a idade? 9 00:00:30,744 --> 00:00:34,000 E quais são as duas frutas preferidas? 10 00:00:34,000 --> 00:00:36,569 O primeiro sabor e o segundo sabor? 11 00:00:36,569 --> 00:00:39,973 Dessa forma, a gente vai ter duas tabelas, 12 00:00:39,973 --> 00:00:42,627 então, uma tabela que vai ser a tabela de nós 13 00:00:42,627 --> 00:00:44,677 e uma outra tabela de arestas. 14 00:00:44,677 --> 00:00:48,548 E a partir dessas duas tabelas a gente vai fazer o exercício para criar 15 00:00:48,548 --> 00:00:53,987 tanto a partir de uma aresta, o nosso Network Graph. 16 00:00:53,987 --> 00:00:56,788 E a gente vai criar também um outro exercício 17 00:00:56,788 --> 00:00:58,958 a partir da tabela de nós. 18 00:00:58,958 --> 00:01:01,019 Dessa forma, vai ficar muito mais prático 19 00:01:01,019 --> 00:01:05,377 para vocês conseguirem entender o funcionamento da ferramenta 20 00:01:05,377 --> 00:01:07,540 na criação de Network Graph. 21 00:01:07,540 --> 00:01:09,847 Então aqui na tela, abrindo a ferramenta, 22 00:01:09,847 --> 00:01:13,303 a primeira visualização que a gente tem é aquela tela geral 23 00:01:13,303 --> 00:01:14,974 que vocês já viram. 24 00:01:14,974 --> 00:01:17,022 Então, a primeira coisa que a gente tem que fazer 25 00:01:17,022 --> 00:01:19,702 é entrar aqui em "Arquivo". 26 00:01:19,702 --> 00:01:24,250 Depois a gente tem que clicar aqui em "novo projeto". 27 00:01:24,250 --> 00:01:28,187 Então a gente vai criar ali o nosso novo projeto. 28 00:01:28,187 --> 00:01:29,889 Aqui no novo projeto, 29 00:01:29,889 --> 00:01:32,458 já para deixar salvo e a gente não perder esse arquivo 30 00:01:32,458 --> 00:01:36,529 caso aconteça algum problema, a gente clique em "Salvar como". 31 00:01:36,529 --> 00:01:38,061 E aí é legal a gente colocar o nome 32 00:01:38,061 --> 00:01:40,342 que a gente vai conseguir visualizar depois 33 00:01:40,342 --> 00:01:42,657 eu vou colocar o nome de "rede". 34 00:01:42,657 --> 00:01:46,321 E a gente precisa alterar ao invés de deixar aqui todos os arquivos, 35 00:01:46,321 --> 00:01:51,544 a gente altera para "Arquivos Gephi" e depois "Salvar". 36 00:01:51,544 --> 00:01:55,648 Então pronto, agora a gente já tem o nosso projeto "rede" salvo. 37 00:01:55,648 --> 00:01:57,658 A gente vai fazer dois exercícios. 38 00:01:57,658 --> 00:02:02,068 Então, o primeiro deles a gente vai subir um arquivo de arestas 39 00:02:02,068 --> 00:02:05,291 que a gente já tem ele aqui salvo, ele pronto. 40 00:02:05,291 --> 00:02:08,728 Então, para importar esse arquivo de arestas, 41 00:02:08,728 --> 00:02:12,899 a gente precisa vir aqui em "laboratório de dados". 42 00:02:12,899 --> 00:02:16,843 Depois muda aqui para essa aba de "arestas". 43 00:02:16,843 --> 00:02:18,638 "Importar planilha". 44 00:02:18,638 --> 00:02:19,940 Aqui no "Importar Planilha" 45 00:02:19,940 --> 00:02:23,810 eu preciso encontrar o meu arquivo de "arestas" 46 00:02:23,810 --> 00:02:26,846 que vai estar salvo aqui como "arestas". 47 00:02:26,846 --> 00:02:31,450 Lembrando que tem que ser um arquivo csv para o Gephi conseguir ler. 48 00:02:31,450 --> 00:02:36,355 depois que a gente clicar aqui em "arestas" a gente clica em "abrir". 49 00:02:36,355 --> 00:02:40,927 Agora o Gephi já mostra para você o que tem no seu arquivo. 50 00:02:40,927 --> 00:02:43,830 Ele está te mostrando já que é um arquivo csv. 51 00:02:43,830 --> 00:02:47,208 Ele mostra aqui o local, mostra como que ele está separando 52 00:02:47,208 --> 00:02:48,568 os dados desse arquivo. 53 00:02:48,568 --> 00:02:51,604 Então você vê que está separando por vírgula. 54 00:02:51,604 --> 00:02:55,908 E já está te falando que é um arquivo aqui de arestas 55 00:02:55,908 --> 00:02:59,312 e você mantém aqui a formatação que é o UTF8. 56 00:02:59,312 --> 00:03:04,550 para ele considerar a formatação toda certa aqui dos indicadores. 57 00:03:04,550 --> 00:03:07,186 Depois a gente tem que clicar em "próximo". 58 00:03:07,186 --> 00:03:10,590 Aqui no "próximo" a gente pode manter do jeito que está. 59 00:03:10,590 --> 00:03:13,659 Uma opção que você tem é aqui no "Weight" 60 00:03:13,659 --> 00:03:17,830 você alterar para "float" para indicar que é um número, 61 00:03:17,830 --> 00:03:20,499 mas se deixar em "Double", ele vai funcionar também. 62 00:03:20,499 --> 00:03:22,969 Depois vai clicar em "finalizar". 63 00:03:22,969 --> 00:03:25,071 Agora que você clicou em finalizar, 64 00:03:25,071 --> 00:03:27,974 você mantém aqui como "não dirigido". 65 00:03:27,974 --> 00:03:29,607 E no caso do nosso relatório, 66 00:03:29,607 --> 00:03:31,867 que a gente está criando pela primeira vez, 67 00:03:31,867 --> 00:03:34,346 a gente pode deixar "New workspace" 68 00:03:34,346 --> 00:03:36,706 e depois, "ok". 69 00:03:36,706 --> 00:03:40,286 Agora que a gente importou o nosso arquivo de arestas, 70 00:03:40,286 --> 00:03:42,975 você vai visualizar aqui na tela que a gente já tem 71 00:03:42,975 --> 00:03:46,659 a nossa tabela de dados com as arestas. 72 00:03:46,659 --> 00:03:49,328 Agora, no exercício que a gente está fazendo, 73 00:03:49,328 --> 00:03:52,498 o próprio arquivo vai criar a tabela de nós. 74 00:03:52,498 --> 00:03:54,515 Então, a gente não precisou importar. 75 00:03:54,515 --> 00:03:56,635 Se a gente vem aqui na aba de nós, 76 00:03:56,635 --> 00:04:00,039 está vendo que ele já tem aqui algumas informações? 77 00:04:00,039 --> 00:04:02,777 Então, através da tabela de arestas, 78 00:04:02,777 --> 00:04:07,087 ele considerou que a nossa origem, que era o nome lá das pessoas 79 00:04:07,087 --> 00:04:12,618 e o sabor preferido de fruta delas e ele já criou aqui nós. 80 00:04:12,618 --> 00:04:15,621 Agora, para a gente visualizar o grafo já criado, 81 00:04:15,621 --> 00:04:19,959 o nosso Network Graph, a gente vem aqui em "visão geral" 82 00:04:19,959 --> 00:04:22,628 e você vai visualizar que ele já aparece aqui. 83 00:04:22,628 --> 00:04:26,374 Então aqui, a gente já criou um primeiro Network Graph 84 00:04:26,374 --> 00:04:28,968 e o que a gente pode fazer agora? 85 00:04:28,968 --> 00:04:34,231 Como ele criou ali o cálculo todo, a configuração dos nós, 86 00:04:34,231 --> 00:04:36,308 ele criou automaticamente. 87 00:04:36,308 --> 00:04:39,578 Eu posso criar algumas estatísticas em cima disso, 88 00:04:39,578 --> 00:04:41,647 eu posso criar alguns cálculos. 89 00:04:41,647 --> 00:04:43,959 Então, uma opção que a gente tem é fazer isso. 90 00:04:43,959 --> 00:04:47,119 Eu venho aqui na aba "Estatísticas" 91 00:04:47,119 --> 00:04:49,788 e aqui eu vou executar os cálculos que eu quiser. 92 00:04:49,788 --> 00:04:52,450 Então, eu posso calcular, por exemplo, 93 00:04:52,450 --> 00:04:58,887 uma análise estatística inferencial e eu posso clicar aqui em "executar", 94 00:04:58,887 --> 00:05:02,154 você vai ver que ele sempre vai te trazer o resultado 95 00:05:02,154 --> 00:05:06,839 que aí você pode enxergar aqui qual foi o algoritmo utilizado 96 00:05:06,839 --> 00:05:11,210 qual foi a metodologia que ele utilizou para criar aquele cálculo. 97 00:05:11,210 --> 00:05:13,521 E aí você pode fechar você tem como salvar, 98 00:05:13,521 --> 00:05:15,481 imprimir e tudo mais. 99 00:05:15,481 --> 00:05:18,117 E você pode ir executando outros cálculos. 100 00:05:18,117 --> 00:05:22,087 Eu posso fazer um cálculo aqui de coeficiente de clusterização 101 00:05:22,087 --> 00:05:25,619 coloco aqui em "executar", do um "ok", 102 00:05:25,619 --> 00:05:26,659 aí ele faz a mesma coisa, 103 00:05:26,659 --> 00:05:31,280 ele te traz aqui a visualização desse coeficiente. 104 00:05:31,280 --> 00:05:33,024 E agora, o que acontece? 105 00:05:33,024 --> 00:05:35,234 Quando a gente faz esses cálculos estatísticos, 106 00:05:35,234 --> 00:05:38,205 ele vai acrescentando essas colunas com os cálculos 107 00:05:38,205 --> 00:05:39,705 na nossa tabela de dados. 108 00:05:39,705 --> 00:05:42,074 Então, vamos visualizar como que esse ficou. 109 00:05:42,074 --> 00:05:44,009 Eu venho aqui em "laboratório de dados", 110 00:05:44,009 --> 00:05:46,979 aí você vai ver que ele vai aqui em "arestas". 111 00:05:46,979 --> 00:05:49,880 Ele vai trazendo os cálculos que a gente criar. 112 00:05:49,880 --> 00:05:51,250 Opa, aqui em "nós". 113 00:05:51,250 --> 00:05:54,934 Então ele vai te trazer o clustering de coeficiente, 114 00:05:54,934 --> 00:05:57,656 vai te trazer a inferência. 115 00:05:57,656 --> 00:05:59,917 Aqui como ele está com poucas casas decimais 116 00:05:59,917 --> 00:06:01,527 aí está mostrando tudo zerado. 117 00:06:01,527 --> 00:06:04,196 Mas a tendência é que quando ele faz o cálculo, 118 00:06:04,196 --> 00:06:07,166 ele traga o valor certo aqui. 119 00:06:07,166 --> 00:06:09,134 Então, está funcionando direito. 120 00:06:09,134 --> 00:06:11,196 Aí aqui em "arestas" não acontece nada, 121 00:06:11,196 --> 00:06:13,906 porque o cálculo está lá em "nós". 122 00:06:13,906 --> 00:06:15,618 E voltando aqui para "visão geral", 123 00:06:15,618 --> 00:06:19,015 a gente tem a visão aqui do nosso Network Graph. 124 00:06:19,015 --> 00:06:22,237 Uma opção que a gente tem é se a gente quiser visualizar 125 00:06:22,237 --> 00:06:23,448 o rótulo de dados, 126 00:06:23,448 --> 00:06:25,717 porque agora o gráfico está limpo, né? 127 00:06:25,717 --> 00:06:30,222 Não tem nada. Eu posso clicar aqui nesse "T". 128 00:06:30,222 --> 00:06:34,760 E aí, ele vai habilitar o nosso label, nosso rótulo de dados. 129 00:06:34,760 --> 00:06:36,466 Para funcionar direito, 130 00:06:36,466 --> 00:06:38,986 eu preciso quando você passar o mouse aqui 131 00:06:38,986 --> 00:06:42,158 ele vai te falar que ele está te mostrando o rótulo dos nós. 132 00:06:42,158 --> 00:06:46,477 Mas se a gente voltar na nossa base de dados aqui em nós, 133 00:06:46,477 --> 00:06:49,064 a única informação que ele tem é o ID. 134 00:06:49,064 --> 00:06:51,585 Lá provavelmente ele está considerando label, 135 00:06:51,585 --> 00:06:53,345 por isso que não está mostrando nada. 136 00:06:53,345 --> 00:06:57,516 Então a gente tem como controlar isso para ele mostrar corretamente. 137 00:06:57,516 --> 00:06:59,832 Então eu venho aqui para ele mostrar as arestas, 138 00:06:59,832 --> 00:07:06,067 só que eu clico aqui na "configuração" e aí eu coloco aqui em "nós" o ID, 139 00:07:06,067 --> 00:07:09,895 e aí se eu dou um "ok", está vendo que ele agora aparece? 140 00:07:09,895 --> 00:07:13,965 Então com a configuração que estava ele estava mostrando só o label, 141 00:07:13,965 --> 00:07:16,768 e aí como estava em branco ele não estava trazendo nada, 142 00:07:16,768 --> 00:07:19,905 mas dessa forma ele já te mostra ali os rótulos. 143 00:07:19,905 --> 00:07:22,852 Se eu quiser ver também os rótulos das arestas, 144 00:07:22,852 --> 00:07:26,183 eu posso clicar nesse "T" aqui e aí a mesma coisa 145 00:07:26,183 --> 00:07:29,140 se ele não estiver mostrando é porque ele está considerando o label 146 00:07:29,140 --> 00:07:31,397 e aí eu posso vir aqui em "arestas", 147 00:07:31,397 --> 00:07:36,755 "ID" ou posso selecionar as outras informações que ele exibe também. 148 00:07:36,755 --> 00:07:38,381 Aí você vai visualizar o que ele está mostrando aqui, 149 00:07:38,381 --> 00:07:39,891 mas bem pequeno, 150 00:07:39,891 --> 00:07:43,167 mas já dá para visualizar que ele está ativo. 151 00:07:43,167 --> 00:07:45,397 Agora a gente vai para o segundo exercício. 152 00:07:45,397 --> 00:07:48,633 A diferença desse para o anterior é que, ao invés da gente 153 00:07:48,633 --> 00:07:54,272 importar uma tabela de arestas, agora a gente vai partir pela tabela de nós. 154 00:07:54,339 --> 00:07:56,641 E depois que a gente importar a tabela de nós 155 00:07:56,641 --> 00:08:00,378 que a gente vai importar a tabela de arestas, vamos fazer agora. 156 00:08:00,445 --> 00:08:05,484 Então, voltando aqui pro nosso, para nosso projeto que a gente vai fazer, 157 00:08:05,684 --> 00:08:09,387 a gente vai clicar aqui no laboratório de dados, 158 00:08:09,488 --> 00:08:14,226 vou entrar aqui em nós, na verdade, até para ficar, né? 159 00:08:14,226 --> 00:08:17,596 E não atrapalhar, eu vou voltar para essa área de trabalho que está vazia. 160 00:08:17,662 --> 00:08:22,334 Então vem nós, clique aqui Importar planilha 161 00:08:22,400 --> 00:08:23,268 e aí eu vou procurar a 162 00:08:23,268 --> 00:08:28,206 minha tabela de nós, então procura ela aqui 163 00:08:28,273 --> 00:08:30,709 que está salva como nós e um CSV também. 164 00:08:30,709 --> 00:08:34,179 Do mesmo jeito que as arestas aí nesse daqui. 165 00:08:34,279 --> 00:08:37,515 Mesma coisa, ele vai te mostrar a separação, 166 00:08:37,515 --> 00:08:39,851 então você tem que confirmar né? 167 00:08:39,851 --> 00:08:43,421 Se ele está separando por vírgula porque é um arquivo CSV, 168 00:08:43,488 --> 00:08:49,594 se é uma tabela de nós e se tá com a configuração correta de UTF oito. 169 00:08:49,661 --> 00:08:51,429 Depois eu bem próximo. 170 00:08:51,429 --> 00:08:55,333 Tenho que confirmar também se os meus campos estão descritos da forma 171 00:08:55,333 --> 00:08:59,704 correta, então nós tem que ser um texto, por isso que está string aqui 172 00:08:59,771 --> 00:09:04,609 e o que for número eu tenho que confirmar também está número, que é o caso aqui 173 00:09:04,609 --> 00:09:09,581 de idade, então idade é um número inteiro, por isso que ele está aqui como Integer. 174 00:09:09,648 --> 00:09:12,350 Depois eu clico em finalizar 175 00:09:12,450 --> 00:09:12,684 aqui. 176 00:09:12,684 --> 00:09:16,988 No finalizar eu preciso só fazer uma alteração no tipo de grafo 177 00:09:16,988 --> 00:09:20,792 ao invés de misturado, eu tenho que colocar como não dirigido 178 00:09:20,859 --> 00:09:25,263 e aí pra ele não criar um novo espaço eu posso colocar aqui um apêndice 179 00:09:25,330 --> 00:09:30,034 que eu sei que existem workspace que ele vai considerar na mesma pasta de trabalho 180 00:09:30,101 --> 00:09:32,704 e aí eu dou um ok, 181 00:09:32,704 --> 00:09:35,707 agora que eu fiz esse OK, você vai ver que a tabela de nós 182 00:09:35,707 --> 00:09:40,111 está criada ali, do mesmo jeitinho que estava o nosso arquivo 183 00:09:40,178 --> 00:09:42,647 e a tabela de arestas está em branca. 184 00:09:42,647 --> 00:09:45,550 Então eu tenho aqui nós e nesse caso, 185 00:09:45,550 --> 00:09:48,553 como eu partida da tabela de nós, 186 00:09:48,586 --> 00:09:51,556 eu preciso incluir agora as arestas. 187 00:09:51,556 --> 00:09:57,529 Então agora eu vou aqui para tabela de arestas e vou clicar em Importar Planilha 188 00:09:57,629 --> 00:09:59,631 aqui no Importar Planilha. 189 00:09:59,631 --> 00:10:01,533 A mesma coisa que a gente fez no anterior 190 00:10:01,533 --> 00:10:05,069 e vou procurar aqui a minha tabela de arestas. 191 00:10:05,170 --> 00:10:07,839 Então arestas, ponto. CSV. 192 00:10:07,839 --> 00:10:11,509 Tá tudo aqui separando por vírgula 193 00:10:11,576 --> 00:10:14,812 certinho e tá falando que é uma tabela de arestas. 194 00:10:14,913 --> 00:10:17,649 Vou aqui no próximo aí a mesma coisa. 195 00:10:17,649 --> 00:10:22,320 Eu posso deixar o what aqui como double ou eu posso mudar ele para fora, que aí 196 00:10:22,320 --> 00:10:27,792 ele vai considerar o número decimal e finalizar aqui no finalizar 197 00:10:27,859 --> 00:10:29,327 não dirigido também. 198 00:10:29,327 --> 00:10:31,629 E eu coloco o Apêndice II que tem workspace 199 00:10:31,629 --> 00:10:34,132 porque ele vai juntar com os nós. 200 00:10:34,132 --> 00:10:36,367 Aí dou um ok. 201 00:10:36,367 --> 00:10:39,370 Pronto, agora que eu dei o OK, eu tenho a tabela de nós 202 00:10:39,370 --> 00:10:43,942 do jeito que a gente importou e eu tenho a tabela de arestas. 203 00:10:44,042 --> 00:10:48,313 Então aqui a gente consegue visualizar que a gente que configurou tudo, né? 204 00:10:48,346 --> 00:10:51,849 Então eu fiz a tabela de nós e fiz a tabela de arestas. 205 00:10:51,916 --> 00:10:54,719 Depois volto aqui para Visão Geral e a gente 206 00:10:54,719 --> 00:10:58,523 consegue visualizar que o nosso novo Network Graph. 207 00:10:58,623 --> 00:11:02,360 E aí para funcionar a questão dos rótulos vai ser a mesma coisa. 208 00:11:02,360 --> 00:11:08,766 Eu posso clicar aqui no desenho de label aqui para a gente olhar o Node 209 00:11:08,833 --> 00:11:12,403 e aí ele vai habilitar e eu posso clicar no desenho 210 00:11:12,403 --> 00:11:16,674 aqui de arestas e ele vai habilitar também as arestas, bem pequenininho ali. 211 00:11:16,774 --> 00:11:20,311 E se eu quiser configurar o que vai aparecer nas arestas, 212 00:11:20,311 --> 00:11:21,813 aí eu posso selecionar. 213 00:11:21,813 --> 00:11:25,416 Então, por exemplo, aqui ele estava considerando label, mas eu posso pegar, 214 00:11:25,416 --> 00:11:29,320 por exemplo, a fruta, furtar um, fruta dois, posso pegar a idade. 215 00:11:29,320 --> 00:11:33,724 Aí eu vou selecionando o que eu quero que apareça no meu network iguais. 216 00:11:33,791 --> 00:11:38,596 Claro que, como você vai analisar, você precisa escolher exatamente ali 217 00:11:38,596 --> 00:11:42,867 o que que vai fazer mais sentido nessa sua visão. 218 00:11:42,967 --> 00:11:47,605 Agora que você já importou a tabela de nós e a tabela de arestas, 219 00:11:47,605 --> 00:11:53,144 você consegue analisar o seu Network Graph e entendendo o relacionamento 220 00:11:53,144 --> 00:11:56,914 entre os seus nós e as suas arestas e criando essas análises, 221 00:11:56,914 --> 00:11:58,983 você pode usar a parte estatística aqui 222 00:11:58,983 --> 00:12:01,986 para fazer alguns cálculos que nem a gente fez no anterior. 223 00:12:02,153 --> 00:12:05,656 E aí, dessa forma, você já seguiu o passo a passo 224 00:12:05,656 --> 00:12:08,659 e conseguiu criar o seu primeiro Network Graph. 225 00:12:08,860 --> 00:12:11,562 Você sabe que eu já fiz uma ferramenta que você pode contar 226 00:12:11,562 --> 00:12:15,633 para esse tipo de criação visual e pode te ajudar nas suas análises. 227 00:12:15,633 --> 00:12:19,670 Então siga esses passos, utiliza seus arquivos 228 00:12:19,670 --> 00:12:24,442 e você vai conseguir entender muito melhor o relacionamento entre os seus dados e.