1 00:00:07,810 --> 00:00:10,129 Agora que você já teve um overview, 2 00:00:10,129 --> 00:00:13,513 já entendeu o funcionamento geral da ferramenta Gephi, 3 00:00:13,513 --> 00:00:16,282 a gente vai partir para um exercício prático. 4 00:00:16,282 --> 00:00:19,539 Para criar esse exercício prático, 5 00:00:19,539 --> 00:00:22,555 a gente vai utilizar uma base de dados 6 00:00:22,555 --> 00:00:25,393 que considera o nome de algumas pessoas, 7 00:00:25,393 --> 00:00:27,393 algumas características sobre elas. 8 00:00:27,393 --> 00:00:30,744 Então, qual é o gênero? Qual é a idade? 9 00:00:30,744 --> 00:00:34,000 E quais são as duas frutas preferidas? 10 00:00:34,000 --> 00:00:36,569 O primeiro sabor e o segundo sabor. 11 00:00:36,569 --> 00:00:39,803 Dessa forma, a gente vai ter duas tabelas, 12 00:00:39,803 --> 00:00:42,627 então, uma que vai ser a tabela de nós 13 00:00:42,627 --> 00:00:44,677 e uma outra tabela de arestas. 14 00:00:44,677 --> 00:00:48,548 E a partir dessas duas tabelas a gente vai fazer o exercício para criar 15 00:00:48,548 --> 00:00:53,987 tanto a partir de uma aresta, o nosso Network Graph, 16 00:00:53,987 --> 00:00:56,827 e a gente vai criar também um outro exercício 17 00:00:56,827 --> 00:00:58,958 a partir da tabela de nós. 18 00:00:58,958 --> 00:01:01,019 Dessa forma, vai ficar muito mais prático 19 00:01:01,019 --> 00:01:05,377 para vocês conseguirem entender o funcionamento da ferramenta 20 00:01:05,377 --> 00:01:07,535 na criação de Network Graph. 21 00:01:07,535 --> 00:01:09,847 Então aqui na tela, abrindo a ferramenta, 22 00:01:09,847 --> 00:01:13,303 a primeira visualização que a gente tem é aquela tela geral 23 00:01:13,303 --> 00:01:14,974 que vocês já viram. 24 00:01:14,974 --> 00:01:17,022 Então, a primeira coisa que a gente tem que fazer 25 00:01:17,022 --> 00:01:19,702 é entrar aqui em "arquivo". 26 00:01:19,702 --> 00:01:24,250 Depois a gente tem que clicar aqui em "novo projeto". 27 00:01:24,250 --> 00:01:28,187 Então a gente vai criar ali o nosso novo projeto. 28 00:01:28,187 --> 00:01:29,889 Aqui no novo projeto, 29 00:01:29,889 --> 00:01:32,458 já para deixar salvo e a gente não perder esse arquivo 30 00:01:32,458 --> 00:01:36,529 caso aconteça algum problema, a gente clique em "salvar como". 31 00:01:36,529 --> 00:01:38,081 E aí é legal a gente colocar o nome 32 00:01:38,081 --> 00:01:40,342 que a gente vai conseguir visualizar depois. 33 00:01:40,342 --> 00:01:42,657 Eu vou colocar o nome de "rede". 34 00:01:42,657 --> 00:01:44,341 E a gente precisa alterar, 35 00:01:44,341 --> 00:01:46,341 ao invés de deixar aqui todos os arquivos, 36 00:01:46,341 --> 00:01:51,544 a gente altera para "arquivos Gephi" e depois "salvar". 37 00:01:51,544 --> 00:01:52,074 Então pronto, 38 00:01:52,074 --> 00:01:55,648 agora a gente já tem o nosso projeto "rede" salvo. 39 00:01:55,648 --> 00:01:57,658 A gente vai fazer dois exercícios. 40 00:01:57,658 --> 00:02:02,068 Então, o primeiro deles, a gente vai subir um arquivo de arestas 41 00:02:02,068 --> 00:02:05,291 que a gente já tem ele aqui salvo, ele pronto. 42 00:02:05,291 --> 00:02:08,728 Então, para importar esse arquivo de arestas, 43 00:02:08,728 --> 00:02:12,899 a gente precisa vir aqui em "laboratório de dados". 44 00:02:12,899 --> 00:02:16,843 Depois muda aqui para essa aba de "arestas". 45 00:02:16,843 --> 00:02:18,638 "Importar planilha". 46 00:02:18,638 --> 00:02:19,940 Aqui no importar planilha, 47 00:02:19,940 --> 00:02:23,810 eu preciso encontrar o meu arquivo de "arestas" 48 00:02:23,810 --> 00:02:26,846 que vai estar salvo aqui como "arestas". 49 00:02:26,846 --> 00:02:29,066 Lembrando que tem que ser um arquivo csv 50 00:02:29,066 --> 00:02:31,464 para o Gephi conseguir ler. 51 00:02:31,464 --> 00:02:33,532 Depois que a gente clicar aqui em "arestas", 52 00:02:33,532 --> 00:02:36,355 a gente clica em "abrir". 53 00:02:36,355 --> 00:02:40,927 Agora o Gephi já mostra para você o que tem no seu arquivo. 54 00:02:40,927 --> 00:02:43,830 Ele está te mostrando já que é um arquivo csv. 55 00:02:43,830 --> 00:02:47,208 Ele mostra aqui o local, mostra como ele está separando 56 00:02:47,208 --> 00:02:48,568 os dados desse arquivo. 57 00:02:48,568 --> 00:02:51,604 Então você vê que está separando por vírgula. 58 00:02:51,604 --> 00:02:55,908 E já está te falando que é um arquivo aqui de arestas 59 00:02:55,908 --> 00:02:59,328 e você mantém aqui a formatação que é o UTF8, 60 00:02:59,328 --> 00:03:04,550 para ele considerar a formatação toda certa aqui dos indicadores. 61 00:03:04,550 --> 00:03:07,186 Depois a gente tem que clicar em "próximo". 62 00:03:07,186 --> 00:03:10,590 Aqui no próximo, a gente pode manter do jeito que está. 63 00:03:10,590 --> 00:03:13,659 Uma opção que você tem é aqui no "weight", 64 00:03:13,659 --> 00:03:17,830 você alterar para "float" para indicar que é um número, 65 00:03:17,830 --> 00:03:20,499 mas se deixar em "double", ele vai funcionar também. 66 00:03:20,499 --> 00:03:22,969 Depois vai clicar em "finalizar". 67 00:03:22,969 --> 00:03:25,071 Agora que você clicou em finalizar, 68 00:03:25,071 --> 00:03:27,974 você mantém aqui como "não dirigido". 69 00:03:27,974 --> 00:03:29,607 E no caso do nosso relatório, 70 00:03:29,607 --> 00:03:31,867 que a gente está criando pela primeira vez, 71 00:03:31,867 --> 00:03:34,346 a gente pode deixar "new workspace" 72 00:03:34,346 --> 00:03:36,706 e depois, "ok". 73 00:03:36,706 --> 00:03:40,286 Agora que a gente importou o nosso arquivo de arestas, 74 00:03:40,286 --> 00:03:42,975 você vai visualizar aqui na tela que a gente já tem 75 00:03:42,975 --> 00:03:46,659 a nossa tabela de dados com as arestas. 76 00:03:46,659 --> 00:03:49,328 Agora, no exercício que a gente está fazendo, 77 00:03:49,328 --> 00:03:52,498 o próprio arquivo vai criar a tabela de nós. 78 00:03:52,498 --> 00:03:54,515 Então, a gente não precisou importar. 79 00:03:54,515 --> 00:03:56,635 Se a gente vem aqui na aba de nós, 80 00:03:56,635 --> 00:04:00,039 está vendo que ele já tem aqui algumas informações. 81 00:04:00,039 --> 00:04:02,810 Então, através da tabela de arestas, 82 00:04:02,810 --> 00:04:07,087 ele considerou a nossa origem, que era o nome lá das pessoas 83 00:04:07,087 --> 00:04:12,618 e o sabor preferido de fruta delas, e ele já criou aqui "nós". 84 00:04:12,618 --> 00:04:15,621 Agora, para a gente visualizar o grafo já criado, 85 00:04:15,621 --> 00:04:19,959 o nosso Network Graph, a gente vem aqui em "visão geral" 86 00:04:19,959 --> 00:04:22,628 e você vai visualizar que ele já aparece aqui. 87 00:04:22,628 --> 00:04:26,374 Então aqui, criamos um primeiro Network Graph 88 00:04:26,374 --> 00:04:28,968 e o que a gente pode fazer agora? 89 00:04:28,968 --> 00:04:34,231 Como ele criou ali a configuração dos nós, 90 00:04:34,231 --> 00:04:36,308 ele criou automaticamente, 91 00:04:36,308 --> 00:04:39,578 eu posso criar algumas estatísticas em cima disso, 92 00:04:39,578 --> 00:04:41,647 eu posso criar alguns cálculos. 93 00:04:41,647 --> 00:04:43,959 Então, uma opção que a gente tem é fazer isso. 94 00:04:43,959 --> 00:04:47,119 Eu venho aqui na aba "estatísticas" 95 00:04:47,119 --> 00:04:49,788 e aqui eu vou executar os cálculos que eu quiser. 96 00:04:49,788 --> 00:04:52,450 Então, eu posso calcular, por exemplo, 97 00:04:52,450 --> 00:04:58,887 uma análise estatística inferencial e eu posso clicar aqui em "executar", 98 00:04:58,887 --> 00:05:02,154 você vai ver que ele sempre vai te trazer o resultado 99 00:05:02,154 --> 00:05:06,839 que aí você pode enxergar aqui qual foi o algoritmo utilizado 100 00:05:06,839 --> 00:05:11,210 qual foi a metodologia que ele utilizou para criar aquele cálculo. 101 00:05:11,210 --> 00:05:13,521 E aí você pode fechar você tem como salvar, 102 00:05:13,521 --> 00:05:15,481 imprimir e tudo mais. 103 00:05:15,481 --> 00:05:18,117 E você pode ir executando outros cálculos. 104 00:05:18,117 --> 00:05:22,087 Eu posso fazer um cálculo aqui de coeficiente de clusterização 105 00:05:22,087 --> 00:05:25,619 coloco aqui em "executar", do um "ok", 106 00:05:25,619 --> 00:05:26,659 aí ele faz a mesma coisa, 107 00:05:26,659 --> 00:05:31,280 ele te traz aqui a visualização desse coeficiente. 108 00:05:31,280 --> 00:05:33,024 E agora, o que acontece? 109 00:05:33,024 --> 00:05:35,234 Quando a gente faz esses cálculos estatísticos, 110 00:05:35,234 --> 00:05:38,205 ele vai acrescentando essas colunas com os cálculos 111 00:05:38,205 --> 00:05:39,705 na nossa tabela de dados. 112 00:05:39,705 --> 00:05:42,074 Então, vamos visualizar como que esse ficou. 113 00:05:42,074 --> 00:05:44,009 Eu venho aqui em "laboratório de dados", 114 00:05:44,009 --> 00:05:46,979 aí você vai ver que ele vai aqui em "arestas". 115 00:05:46,979 --> 00:05:49,880 Ele vai trazendo os cálculos que a gente criar. 116 00:05:49,880 --> 00:05:51,250 Opa, aqui em "nós". 117 00:05:51,250 --> 00:05:54,934 Então ele vai te trazer o clustering de coeficiente, 118 00:05:54,934 --> 00:05:57,656 vai te trazer a inferência. 119 00:05:57,656 --> 00:05:59,917 Aqui como ele está com poucas casas decimais 120 00:05:59,917 --> 00:06:01,527 aí está mostrando tudo zerado. 121 00:06:01,527 --> 00:06:04,196 Mas a tendência é que quando ele faz o cálculo, 122 00:06:04,196 --> 00:06:07,166 ele traga o valor certo aqui. 123 00:06:07,166 --> 00:06:09,134 Então, está funcionando direito. 124 00:06:09,134 --> 00:06:11,196 Aí aqui em "arestas" não acontece nada, 125 00:06:11,196 --> 00:06:13,906 porque o cálculo está lá em "nós". 126 00:06:13,906 --> 00:06:15,618 E voltando aqui para "visão geral", 127 00:06:15,618 --> 00:06:19,015 a gente tem a visão aqui do nosso Network Graph. 128 00:06:19,015 --> 00:06:22,237 Uma opção que a gente tem é se a gente quiser visualizar 129 00:06:22,237 --> 00:06:23,448 o rótulo de dados, 130 00:06:23,448 --> 00:06:25,717 porque agora o gráfico está limpo, né? 131 00:06:25,717 --> 00:06:30,222 Não tem nada. Eu posso clicar aqui nesse "T". 132 00:06:30,222 --> 00:06:34,760 E aí, ele vai habilitar o nosso label, nosso rótulo de dados. 133 00:06:34,760 --> 00:06:36,466 Para funcionar direito, 134 00:06:36,466 --> 00:06:38,986 eu preciso quando você passar o mouse aqui 135 00:06:38,986 --> 00:06:42,158 ele vai te falar que ele está te mostrando o rótulo dos nós. 136 00:06:42,158 --> 00:06:46,477 Mas se a gente voltar na nossa base de dados aqui em nós, 137 00:06:46,477 --> 00:06:49,064 a única informação que ele tem é o ID. 138 00:06:49,064 --> 00:06:51,585 Lá provavelmente ele está considerando label, 139 00:06:51,585 --> 00:06:53,345 por isso que não está mostrando nada. 140 00:06:53,345 --> 00:06:57,516 Então a gente tem como controlar isso para ele mostrar corretamente. 141 00:06:57,516 --> 00:06:59,832 Então eu venho aqui para ele mostrar as arestas, 142 00:06:59,832 --> 00:07:06,067 só que eu clico aqui na "configuração" e aí eu coloco aqui em "nós" o ID, 143 00:07:06,067 --> 00:07:09,895 e aí se eu dou um "ok", está vendo que ele agora aparece? 144 00:07:09,895 --> 00:07:13,965 Então com a configuração que estava ele estava mostrando só o label, 145 00:07:13,965 --> 00:07:16,768 e aí como estava em branco ele não estava trazendo nada, 146 00:07:16,768 --> 00:07:19,905 mas dessa forma ele já te mostra ali os rótulos. 147 00:07:19,905 --> 00:07:22,852 Se eu quiser ver também os rótulos das arestas, 148 00:07:22,852 --> 00:07:26,183 eu posso clicar nesse "T" aqui e aí a mesma coisa 149 00:07:26,183 --> 00:07:29,140 se ele não estiver mostrando é porque ele está considerando o label 150 00:07:29,140 --> 00:07:31,397 e aí eu posso vir aqui em "arestas", 151 00:07:31,397 --> 00:07:36,755 "ID" ou posso selecionar as outras informações que ele exibe também. 152 00:07:36,755 --> 00:07:38,381 Aí você vai visualizar o que ele está mostrando aqui, 153 00:07:38,381 --> 00:07:39,891 mas bem pequeno, 154 00:07:39,891 --> 00:07:43,167 mas já dá para visualizar que ele está ativo. 155 00:07:43,167 --> 00:07:45,397 Agora a gente vai para o segundo exercício. 156 00:07:45,397 --> 00:07:47,343 A diferença desse para o anterior 157 00:07:47,343 --> 00:07:50,729 é que, ao invés da gente importar uma tabela de arestas, 158 00:07:50,729 --> 00:07:54,339 agora a gente vai partir pela tabela de nós 159 00:07:54,339 --> 00:07:56,641 e depois que a gente importar a tabela de nós 160 00:07:56,641 --> 00:07:58,715 que a gente vai importar a tabela de arestas, 161 00:07:58,715 --> 00:08:00,117 vamos fazer agora. 162 00:08:00,117 --> 00:08:04,444 Então, voltando aqui para o nosso projeto , 163 00:08:04,444 --> 00:08:05,699 o que a gente vai fazer? 164 00:08:05,699 --> 00:08:09,488 A gente vai clicar aqui no "laboratório de dados", 165 00:08:09,488 --> 00:08:13,146 vou entrar aqui em "nós", na verdade, 166 00:08:13,146 --> 00:08:15,146 até para não atrapalhar, 167 00:08:15,146 --> 00:08:17,662 vou voltar para essa área de trabalho que está vazia. 168 00:08:17,662 --> 00:08:22,400 Então vem em "nós", clico aqui "Importar planilha" 169 00:08:22,400 --> 00:08:25,752 e aí eu vou procurar a minha tabela de "nós". 170 00:08:25,752 --> 00:08:29,453 Então procuro ela aqui, aqui está salva como "nós" 171 00:08:29,453 --> 00:08:33,059 é um csv também, do mesmo jeito que as arestas. 172 00:08:33,059 --> 00:08:37,515 Aí nesse daqui mesma coisa, ele vai te mostrar a separação, 173 00:08:37,515 --> 00:08:39,851 então você tem que confirmar né? 174 00:08:39,851 --> 00:08:43,488 Se ele está separando por vírgula porque é um arquivo csv, 175 00:08:43,488 --> 00:08:45,461 se é uma tabela de nós 176 00:08:45,461 --> 00:08:49,661 e se está com a configuração correta de UTF8. 177 00:08:49,661 --> 00:08:51,429 Depois eu venho em "próximo". 178 00:08:51,429 --> 00:08:52,893 Tenho que confirmar também, 179 00:08:52,893 --> 00:08:56,093 se os meus campos estão descritos da forma correta, 180 00:08:56,093 --> 00:08:59,731 então o nó tem que ser um texto, por isso que está string aqui 181 00:08:59,731 --> 00:09:03,759 e o que for número eu tenho que confirmar também se está número, 182 00:09:03,759 --> 00:09:07,368 que é o caso aqui de idade, então idade é um número inteiro, 183 00:09:07,368 --> 00:09:09,648 por isso que ele está aqui como "Integer". 184 00:09:09,648 --> 00:09:12,370 Depois eu clico em "finalizar" 185 00:09:12,370 --> 00:09:15,698 Aqui no finalizar eu preciso só fazer uma alteração. 186 00:09:15,698 --> 00:09:18,429 No tipo de grafo ao invés de "misturado", 187 00:09:18,429 --> 00:09:20,859 eu tenho que colocar como "não dirigido" 188 00:09:20,859 --> 00:09:23,030 e aí para ele não criar um novo workspace 189 00:09:23,030 --> 00:09:26,960 eu posso colocar aqui um "append to existing workspace" 190 00:09:26,960 --> 00:09:30,101 que ele vai considerar na mesma pasta de trabalho 191 00:09:30,101 --> 00:09:32,704 e aí eu dou um "ok". 192 00:09:32,704 --> 00:09:34,027 Agora que eu fiz esse "OK", 193 00:09:34,027 --> 00:09:37,057 você vai ver que a tabela de nós está criada, 194 00:09:37,057 --> 00:09:40,178 do mesmo jeito que estava o nosso arquivo 195 00:09:40,178 --> 00:09:42,647 e a tabela de arestas está em branca. 196 00:09:42,647 --> 00:09:45,550 Então, eu tenho aqui nós e nesse caso, 197 00:09:45,550 --> 00:09:51,556 como eu parti da tabela de nós, eu preciso incluir agora as arestas. 198 00:09:51,556 --> 00:09:54,429 Então agora eu vou aqui para tabela de "arestas" 199 00:09:54,429 --> 00:09:57,571 e vou clicar em "Importar Planilha". 200 00:09:57,571 --> 00:09:59,631 Aqui no "Importar Planilha" 201 00:09:59,631 --> 00:10:01,983 a mesma coisa que a gente fez no anterior 202 00:10:01,983 --> 00:10:05,170 vou procurar aqui a minha tabela de "arestas". 203 00:10:05,170 --> 00:10:07,719 Então, "arestas.csv". 204 00:10:07,719 --> 00:10:12,066 Está tudo aqui separando por vírgula, certo. 205 00:10:12,066 --> 00:10:14,913 E está falando que é uma tabela de arestas. 206 00:10:14,913 --> 00:10:17,713 Vou aqui no próximo, aí a mesma coisa. 207 00:10:17,713 --> 00:10:20,083 Eu posso deixar o "Weight" aqui como "Double" 208 00:10:20,083 --> 00:10:22,080 ou eu posso mudar ele para "Float", 209 00:10:22,080 --> 00:10:26,409 que aí ele vai considerar que é um número decimal e "finalizar". 210 00:10:26,409 --> 00:10:29,327 Aqui no "finalizar" "não dirigido" também. 211 00:10:29,327 --> 00:10:31,669 E eu coloco o "Append to existing workspace", 212 00:10:31,669 --> 00:10:34,132 porque ele vai juntar com os nós. 213 00:10:34,132 --> 00:10:36,367 Aí dou um "ok". 214 00:10:36,367 --> 00:10:39,370 Pronto, agora que eu dei o "ok", eu tenho a tabela de nós 215 00:10:39,370 --> 00:10:44,042 do jeito que a gente importou e eu tenho a tabela de arestas. 216 00:10:44,042 --> 00:10:46,454 Então aqui a gente consegue visualizar 217 00:10:46,454 --> 00:10:48,346 que a gente que configurou tudo, né? 218 00:10:48,346 --> 00:10:51,916 Então eu fiz a tabela de nós e fiz a tabela de arestas. 219 00:10:51,916 --> 00:10:55,869 Depois volto aqui para "Visão Geral" e a gente consegue visualizar 220 00:10:55,869 --> 00:10:58,594 aqui o nosso novo Network Graph. 221 00:10:58,594 --> 00:11:02,399 E aí para funcionar a questão dos rótulos vai ser a mesma coisa. 222 00:11:02,399 --> 00:11:08,733 Posso clicar aqui no "T" de label aqui para a gente olhar o nós. 223 00:11:08,733 --> 00:11:13,403 E aí, ele vai habilitar e eu posso clicar no "T" aqui de arestas 224 00:11:13,403 --> 00:11:16,774 e ele vai habilitar também as arestas, bem pequeno ali. 225 00:11:16,774 --> 00:11:20,311 E se eu quiser configurar o que vai aparecer nas arestas, 226 00:11:20,311 --> 00:11:21,813 aí eu posso selecionar. 227 00:11:21,813 --> 00:11:22,476 Então, por exemplo, 228 00:11:22,476 --> 00:11:25,366 aqui ele estava considerando "label", mas eu posso pegar, 229 00:11:25,366 --> 00:11:29,320 por exemplo, a fruta, fruta um, fruta dois, posso pegar a idade. 230 00:11:29,320 --> 00:11:32,031 Aí eu vou selecionando o que eu quero que apareça 231 00:11:32,031 --> 00:11:33,819 no meu Network Graph. 232 00:11:33,819 --> 00:11:38,596 Claro que, como você vai analisar, você precisa escolher exatamente 233 00:11:38,596 --> 00:11:42,967 o que vai fazer mais sentido nessa sua visão. 234 00:11:42,967 --> 00:11:47,605 Agora que você já importou a tabela de nós e a tabela de arestas, 235 00:11:47,605 --> 00:11:51,144 você consegue analisar o seu Network Graph 236 00:11:51,144 --> 00:11:54,054 e entendendo o relacionamento entre os seus nós 237 00:11:54,054 --> 00:11:56,914 e as suas arestas e criando essas análises, 238 00:11:56,914 --> 00:12:00,301 você pode usar a parte estatística aqui para fazer alguns cálculos 239 00:12:00,301 --> 00:12:02,153 que nem a gente fez no anterior. 240 00:12:02,153 --> 00:12:05,656 E aí, dessa forma, você já seguiu o passo a passo 241 00:12:05,656 --> 00:12:08,802 e conseguiu criar o seu primeiro Network Graph. 242 00:12:08,802 --> 00:12:11,562 Você sabe que Gephi é uma ferramenta que você pode contar 243 00:12:11,562 --> 00:12:15,633 para esse tipo de criação visual e pode te ajudar nas suas análises. 244 00:12:15,633 --> 00:12:19,670 Então siga esses passos, utiliza seus arquivos 245 00:12:19,670 --> 00:12:21,722 e você vai conseguir entender muito melhor 246 00:12:21,722 --> 00:12:24,182 o relacionamento entre os seus dados.