Extração de dados da Plataforma Lattes: análise da rede de colaboração científica dos professores do PPGCC –
UFLA
Miguel Thiago AlvarengaThiago Bellotti Furtado
Programa de Pós-Graduação em Ciência da Computação – PPGCCEstudos Avançados em Mineração WEB e Aplicações - PCC519
[email protected] – [email protected] de abril de 2023
1. Contexto
2. Objetivo
3. Ferramentas
4. Análises das redes
5. Referencial Teórico
Sumário
219 de abril de 2023 [email protected] – [email protected]
Contexto
319 de abril de 2023 [email protected] – [email protected]
• “Rede é uma abstração que permite codificar algum tipo de relacionamento entre pares de objetos” (Figueiredo, 2013).
• Vários tipos de formações de redes
• Como entender seu comportamento?
• Entender sua topologia.
• Influências nos processos e funcionalidades
• Modelos Matemáticos• Capturar aspectos topológicos
Objetivo
419 de abril de 2023 [email protected] – [email protected]
Coletar informações científicas dos professores do Programa de Pós Graduação do Departamento de Ciência da Computação – PPGC na Plataforma Lattes, gerando uma rede de relacionamento para análise de interatividade.
Ferramentas
519 de abril de 2023 [email protected] – [email protected]
2 ferramentas foram utilizadas:
• ScriptLattes:• Linguagem Python (Open Source);• Coletar dados automatizada no Lattes;• Grafos, Representação Espacial e Gráficos;• Saída em HTML para análise dos resultados;• Arquivos de configuração (.conf e .list);• Base de dados em .gdf e .txt;• http://scriptlattes.sourceforge.net/;• Versão 8.09 (não gera xml).
Ferramentas
619 de abril de 2023 [email protected] – [email protected]
• Gephi:• Versão 0.8.2;• Linguagem Java;• Análise de Redes;• Funções para analisar a topologia da rede;• https://gephi.github.io/
Ferramentas
719 de abril de 2023 [email protected] – [email protected]
• ScriptLattes:
Arquivo .list
Id Lattes Nome Autor (vértices)
1 - Configurar o arquivo .list informando os dados do autor
Ferramentas
819 de abril de 2023 [email protected] – [email protected]
• ScriptLattes:
Arquivo .config
2 - Configurar o arquivo .config informando os dados a serem coletados
Ferramentas
919 de abril de 2023 [email protected] – [email protected]
• ScriptLattes:
2 - Execução
$ cd <nome_diretorio_scriptLattes> $ ./scriptLattes.py ./exemplo/teste-03.config
- Index.html- Teste-03.gdf- .css- .txt
Ferramentas
1019 de abril de 2023 [email protected] – [email protected]
• ScriptLattes:3 - Resultados
Ferramentas
1119 de abril de 2023 [email protected] – [email protected]
• Gephi:• Dados coletados pelo ScriptLattes importados no Gephi
Análise da Rede
1219 de abril de 2023 [email protected] – [email protected]
Distribuição de Grau: 0.899• Conexões entre os nós da rede
Análise da Rede
1319 de abril de 2023 [email protected] – [email protected]
Caminhos e Distância:Sequência de vértice sem repetição onde exista uma aresta Quão separados estão os dois nós mais distantes
Análise da Rede
1419 de abril de 2023 [email protected] – [email protected]
Colaboração Produção Bibliográfica
Análise da Rede
1519 de abril de 2023 [email protected] – [email protected]
Artigo em Periódico Livros
Análise da Rede
1619 de abril de 2023 [email protected] – [email protected]
Trabalho em congresso Capítulo de Livro
Análise da Rede
1719 de abril de 2023 [email protected] – [email protected]
Excentricidade Centralidade
Análise da Rede
1819 de abril de 2023 [email protected] – [email protected]
Centralidade de intermediação:Frequência que um nó aparece em caminhos mais curtos entre nós
da rede.
Análise da Rede
1919 de abril de 2023 [email protected] – [email protected]
Centralidade de proximidade:Distância média de um determinado nó inicial para todos os
demais nós da rede.
Análise da Rede
2019 de abril de 2023 [email protected] – [email protected]
Excentricidade:Distância de um determinado nó inicial até o nó mais distante dele
na rede.
Análise da Rede
2119 de abril de 2023 [email protected] – [email protected]
Coeficiente de Clusterização: 0,000 (triangulação = 0) Indica como os nós estão inseridos em sua vizinhança Qual a chance de dois vértices que se conectam estarem
conectados a outro
Análise da Rede
2219 de abril de 2023 [email protected] – [email protected]
Densidade da rede: 0,11 Mede quanto que uma rede está próxima de ser completa.
Análise da Rede
2319 de abril de 2023 [email protected] – [email protected]
HITS: Calcula dois valores distintos para cada nó: Authirity e Hub; Authirity: mede o quanto são valiosas as informações
armazenada naquele nó; Hub: mede a qualidade das conexões deste nó.
Análise da Rede
2419 de abril de 2023 [email protected] – [email protected]
PageRank: Classifica as “páginas” dos nós de acordo com a frequência com
que um usuário, seguindo ligações de maneira não aleatória, chega à “página” do nó.
Referências Bibliográficas
2519 de abril de 2023 [email protected] – [email protected]
Mena-Chalco, J. P; Cesar Junior, R. M. ScriptLattes: an open-source knowledge extraction system from the Lattes platform. Journal of the Brazilian Computer Society, 15(4), 31-39. Recuperado em 10 de setembro de 2014, de http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-65002009000400004&lng=pt&tlng=en. 10.1007/BF03194511.
ScriptLattes: uma ferramenta para extração e visualização de conhecimento a partir de Currículo Lattes. Disponível em <http://scriptlattes.sourceforge.net/>
Gephi: makes graphs handy. Disponível em <https://gephi.github.io/users/download/>
Figueiredo, D. R. Introdução a Redes Complexas. Em: de Souza, A.F., Jr. Meira, W. (editores), Atualizações em Informática 2011, PUC-Rio, Cap. 7, pp 303--358, 2011
2719 de abril de 2023
Obrigado!
[email protected] – [email protected]
1. Dados de 2010 a 20142. Gerar 3 redes:
1. Somente professores DCC 2. Todos professores Mestrado3. Todos professores DCC
3. Gerar rede UFOP do mestrado