Article Brapci-Autoridades

Um método para identificação de colaborações em grandes bases de dados científicos

A method for the identification of collaboration in large scientific databases

The analysis of scientific collaboration networks has contributed significantly to improve the understanding of the collaboration process between researchers. Additionally, it has helped to understand how scientific productions by researchers and research groups evolve. However, the identification of collaborations in large scientific databases is not a trivial task, given the high computational cost of the prevalent methods. This paper proposes a method for identifying collaborations in large scientific databases, namely, ISColl – Identification of Scientific Collaboration. Unlike methods that use techniques such as exhaustive comparisons of publication pairs, the proposed method produces satisfactory results with a low computational cost, thus providing an interesting alternative for the modelling and characterization of large scientific collaboration networks. To demonstrate the potential of the proposed technique, tests were conducted using scientific publications data registered in the Lattes Platform of CNPq, with the obtained results yielding excellent accuracy during the identification of scientific collaborations.@en


A análise de redes de colaboração científica tem contribuído significativamente para melhorar a compreensão do processo de colaboração entre os pesquisadores. Além disso, tem ajudado a compreender como as produções científicas de pesquisadores e grupos de pesquisa têm evoluído. No entanto, a identificação de colaborações em grandes repositórios de dados científicos não é uma tarefa trivial, tendo em vista o alto custo computacional dos métodos frequentemente utilizados. Este artigo propõe um método para identificar colaborações em grandes repositórios de dados científicos, denominado ISColl – Identificação de Colaboração Científica. Ao contrário dos métodos que utilizam técnicas como a validação cruzada, o método proposto produz resultados satisfatórios com um baixo custo computacional, proporcionando, assim, uma alternativa interessante para a modelagem e caracterização de grandes redes de colaboração científica. Para comprovar todo o potencial do método proposto, são realizados testes com dados de publicações científicas da Plataforma Lattes do CNPq, obtendo excelentes resultados para o processo de identificação de colaborações científicas.@pt

. A method for the identification of collaboration in large scientific databases um método para identificação de colaborações em grandes bases de dados científicos. Em questão, [????].

References

  • ALVES, A. D.., YANASSE, H. H.., SOMA, N. Y. LattesMiner: a multilingual DSL for information extraction from lattes platform. In: CONFERENCE ON SYSTEMS, PROGRAMMING, AND APPLICATIONS: SOFTWARE FOR HUMANITY, 2011, Portland. Proceedings… New York: ACM 2011. p. 85-92.
  • BAEZA-YATES, R. A.., RIBEIRO-NETO, B. A. Recuperação de informação: conceitos e tecnologia das máquinas de busca. 2. ed. Porto Alegre: Bookman, 2013.
  • CAÑIBANO, C.., BOZEMAN, B. Curriculum vitae method in science policy and research evaluation: the state-of-the-art. Research Evaluation, Oxford, v. 18, n. 2, p. 86-94, 2009.
  • DIAS, T. M. R. et al. Modelagem e caracterização de redes científicas: um estudo sobre a Plataforma Lattes. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING, 2., 2013, Maceió. Anais... [S.l.]: UFMG, UFRJ, 2013.
  • DIGIAMPIETRI, L. A.., et al. BraX-Ray: an x-ray of the brazilian computer science graduate programs. PLoS One, San Francisco, v. 9, p. e94541, 2014.
  • DIGIAMPIETRI, L.., MUGNAINI, R.., ALVES, C. Analysis of participation in supervised production of advisors: a case study in computer science. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING, 2., 2013, Maceió. Anais... [S.l.]: UFMG, UFRJ, 2013.
  • DIGIAMPIETRI, L. et al. Dinâmica das relações de coautoria nos programas de Pós-Graduação em Computação no Brasil. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING, 2012, Curitiba. Anais... Curitiba: UFPR, 2012.
  • DING, Y. Scientific collaboration and endorsement: network analysis of coauthorship and citation networks. Journal of Informetrics, Amsterdam, v. 5, n. 1, p. 187-203, 2011.
  • FERNANDES, G. O.., SAMPAIO, J. O.., SOUZA, J. M. XMLattes: a tool for importing and exporting curricula data. In: WORLD CONGRESS IN COMPUTER SCIENCE, COMPUTER ENGINEERING, AND APPLIED COMPUTING, 2011, Las Vegas. Proceedings... Las Vegas: WORLDCOMP, 2011.
  • GAYEN, A.., CHANDRA, J. Role of trust in evolution of scientific collaboration networks. In: INTERNATIONAL CONFERENCE ON SOCIAL COMPUTING, 7., 2014, Beijing. Proceedings... New York: ACM, 2014.
  • LAENDER, A. et al. Ciência Brasil - the brazilian portal of science and technology. In: SEMINÁRIO INTEGRADO DE SOFTWARE E HARDWARE, 38., 2011, Natal. Anais eletrônicos... Natal, 2011.
  • LEE, D. et al. Complete trails of coauthorship network evolution. Physical Review E, New York, v. 82, 026112, 2010.
  • LOPES, G. R. Avaliação e recomendação de colaborações em redes sociais acadêmicas. 2012. Tese (Doutorado em Ciência da Computação) – Curso de Pós-Graduação em Computação, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2012.
  • LOPES, G. R. et al. Ranking strategy for graduate programs evaluation. In: INTERNATIONAL CONFERENCE ON INFORMATION TECHNOLOGY AND APPLICATIONS , 7., 2011, Sydney. Proceedings... Sydney: ICITA, 2011. p. 59-64,
  • MENA-CHALCO, J. P.., CESAR-JUNIOR, R. M. ScriptLattes: an opensource knowledge extraction system from the Lattes platform. Journal of the Brazilian Computer Society, Porto Alegre, v. 15, n. 4, p. 31-39, 2009.
  • MENA-CHALCO, J. P.., DIGIAMPIETRI, L. A.., CESAR-JUNIOR, R. M.. Caracterizando as redes de coautoria de currículos Lattes. In: BRAZILIAN NEWMAN, M. E. J. The structure of scientific collaboration networks. Proceedings of the National Academy of Sciences, Washington, v. 98, n. 2, p. 404-409, 2001a.
  • NEWMAN, M. E. J. Scientific collaboration networks. I. Network construction and fundamental results. Physical Review E, New York, v. 64, n. 1, p. 016131_1-016131_8, 2001b.
  • NEWMAN, M. E. J. Scientific collaboration networks. II. Shortest paths, weighted networks, and centrality. Physical Review E, New York, v. 64, n. 1, p. 016132_1-016132_7, 2001c.
  • NEWMAN, M. E. J. Coauthorship networks and patterns of scientific collaboration. Proceedings of the National Academy of Sciences, Washington, v. 101, suppl. 1, p. 5200-5205, 2004.
  • PETERSEN, A. M. et al. Persistence and uncertainty in the academic career. Proceedings of the National Academy of Sciences, Washington, v. 109, n. 14, p. 5213-5218, 2012.
  • PROCOPIO, S. P., LAENDER, A. H. F., MORO, M. M. Analysis of network co-authoring the brazilian symposium on databases. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 26., 2011, Florianópolis. Anais... Porto Alegre: SBC, 2011.
  • REVOREDO, K. et al. Mining scientific literature for analysis of collaboration in research communities. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING, 2012, Curitiba. Anais... Curitiba: UFPR, 2012.
NLP0.29
Visto 21 vezes
sem referências
Array
(
    [dateOfAvailability] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [2015-09-17] => 8495
                        )

                )

        )

    [hasAuthor] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Thiago Magela Rodrigues Dias] => 9200
                        )

                    [1] => Array
                        (
                            [Gray Farias Moita] => 9201
                        )

                )

        )

    [hasFileStorage] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [_repository/47/2018/09/oai_seer_ufrgs_br_article_53259#00002.pdf] => 96535
                        )

                )

        )

    [hasPageEnd] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [161] => 2187
                        )

                )

        )

    [hasPageStart] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [140] => 1494
                        )

                )

        )

    [hasSectionOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Artigo] => 3
                        )

                )

        )

    [hasSubject] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciências sociais aplicadas] => 234537
                        )

                    [1] => Array
                        (
                            [Ciência da informação] => 237157
                        )

                    [2] => Array
                        (
                            [Extração e integração de dado] => 89109
                        )

                    [3] => Array
                        (
                            [Recuperação de informação] => 282411
                        )

                    [4] => Array
                        (
                            [Identificação de colaboração] => 267704
                        )

                    [5] => Array
                        (
                            [Extração e integração de dados] => 267703
                        )

                    [6] => Array
                        (
                            [Recuperação de informações] => 115188
                        )

                    [7] => Array
                        (
                            [Ciências sociais aplicadas] => 9181
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Extraction and data integration] => 89107
                        )

                    [1] => Array
                        (
                            [Information retrieval] => 227532
                        )

                    [2] => Array
                        (
                            [Identification of collaboration] => 267702
                        )

                )

        )

    [wasPublicationInDate] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [2015-09-17] => 267627
                        )

                )

        )

    [hasLanguageExpression] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [en] => 232773
                        )

                )

        )

    [hasLicense] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Copyright (c)] => 232755
                        )

                    [1] => Array
                        (
                            [CCBY4.0] => 232756
                        )

                )

        )

    [isPartOfSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Em questão] => 47
                        )

                )

        )

    [hasIssueOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:00002-2015-21-2] => 8493
                        )

                )

        )

    [hasAbstract] => Array
        (
            [en] => Array
                (
                    [0] => Array
                        (
                            [The analysis of scientific collaboration networks has contributed significantly to improve the understanding of the collaboration process between researchers. Additionally, it has helped to understand how scientific productions by researchers and research groups evolve. However, the identification of collaborations in large scientific databases is not a trivial task, given the high computational cost of the prevalent methods. This paper proposes a method for identifying collaborations in large scientific databases, namely, ISColl – Identification of Scientific Collaboration. Unlike methods that use techniques such as exhaustive comparisons of publication pairs, the proposed method produces satisfactory results with a low computational cost, thus providing an interesting alternative for the modelling and characterization of large scientific collaboration networks. To demonstrate the potential of the proposed technique, tests were conducted using scientific publications data registered in the Lattes Platform of CNPq, with the obtained results yielding excellent accuracy during the identification of scientific collaborations.] => 0
                        )

                    [1] => Array
                        (
                            [The analysis of scientific collaboration networks has contributed significantly to improve the understanding of the collaboration process between researchers. Additionally, it has helped to understand how scientific productions by researchers and research groups evolve. However, the identification of collaborations in large scientific databases is not a trivial task, given the high computational cost of the prevalent methods. This paper proposes a method for identifying collaborations in large scientific databases, namely, ISColl – Identification of Scientific Collaboration. Unlike methods that use techniques such as exhaustive comparisons of publication pairs, the proposed method produces satisfactory results with a low computational cost, thus providing an interesting alternative for the modelling and characterization of large scientific collaboration networks. To demonstrate the potential of the proposed technique, tests were conducted using scientific publications data registered in the Lattes Platform of CNPq, with the obtained results yielding excellent accuracy during the identification of scientific collaborations.] => 0
                        )

                )

            [pt] => Array
                (
                    [0] => Array
                        (
                            [A análise de redes de colaboração científica tem contribuído significativamente para melhorar a compreensão do processo de colaboração entre os pesquisadores. Além disso, tem ajudado a compreender como as produções científicas de pesquisadores e grupos de pesquisa têm evoluído. No entanto, a identificação de colaborações em grandes repositórios de dados científicos não é uma tarefa trivial, tendo em vista o alto custo computacional dos métodos frequentemente utilizados. Este artigo propõe um método para identificar colaborações em grandes repositórios de dados científicos, denominado ISColl – Identificação de Colaboração Científica. Ao contrário dos métodos que utilizam técnicas como a validação cruzada, o método proposto produz resultados satisfatórios com um baixo custo computacional, proporcionando, assim, uma alternativa interessante para a modelagem e caracterização de grandes redes de colaboração científica. Para comprovar todo o potencial do método proposto, são realizados testes com dados de publicações científicas da Plataforma Lattes do CNPq, obtendo excelentes resultados para o processo de identificação de colaborações científicas.] => 0
                        )

                )

        )

    [hasID] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [oai:seer.ufrgs.br:article/53259] => 0
                        )

                )

        )

    [hasRegisterId] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [http://seer.ufrgs.br/EmQuestao/article/view/53259] => 0
                        )

                    [1] => Array
                        (
                            [10.19132/1808-5245212.140-161] => 0
                        )

                    [2] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/view/53259] => 0
                        )

                )

        )

    [hasSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Em Questão; v.21, n.2, mai./ago. 2015; 140-161] => 0
                        )

                    [1] => Array
                        (
                            [1808-5245] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [1807-8893] => 0
                        )

                )

        )

    [hasTitle] => Array
        (
            [en] => Array
                (
                    [0] => Array
                        (
                            [A method for the identification of collaboration in large scientific databases] => 0
                        )

                )

            [pt] => Array
                (
                    [0] => Array
                        (
                            [Um método para identificação de colaborações em grandes bases de dados científicos] => 0
                        )

                )

        )

    [hasUrl] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [http://seer.ufrgs.br/EmQuestao/article/view/53259/34340] => 0
                        )

                    [1] => Array
                        (
                            [http://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/53259/28297] => 0
                        )

                    [2] => Array
                        (
                            [http://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/53259/28298] => 0
                        )

                    [3] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/view/53259/34340] => 0
                        )

                    [4] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/53259/28297] => 0
                        )

                    [5] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/53259/28298] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [https://seer.ufrgs.br/index.php/EmQuestao/article/view/53259] => 0
                        )

                    [1] => Array
                        (
                            [https://seer.ufrgs.br/index.php/EmQuestao/article/view/53259/34340] => 0
                        )

                )

        )

    [prefLabel] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Oai:seer.ufrgs.br:article/53259#00002] => 0
                        )

                )

        )

    [hasDOI] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [10.19132/1808-5245212.140-161] => 0
                        )

                )

        )

)