Article Brapci-Revistas

Qualidade de dados em gestão de dados de pesquisa: um estudo bibliométrico

Data quality in research data management: a bibliometric study

A gestão dos dados de pesquisa é reconhecida pela comunidade científica como parte importante das boas práticas de pesquisa, de modo que esses dados devem estar disponíveis para acesso e reuso. No âmbito da gestão dos dados de pesquisa, a curadoria e a qualidade de dados são entendidos como elementos estratégicos. Este trabalho tem como objetivo mensurar a produção científica existente sobre o tema “qualidade de dados em gestão de dados de pesquisa”, por meio da aferição de indicadores bibliométricos. Em termos metodológicos, possui natureza quantitativa e qualitativa, é exploratório quanto a seus objetivos e utiliza-se das bases de dados Web of Science e Scopus para composição do corpus do estudo bibliométrico. Como resultado, identificou-se a partir de um corpus de 77 artigos, que o período com publicações se estende entre os anos de 1984 e 2020, sendo 2019 aquele no qual mais trabalhos foram publicados, com 13 publicações; 7 veículos de publicação apresentaram mais de uma publicação para o tópico pesquisado; os Estados Unidos são o país com mais trabalhos publicados, totalizando 34 artigos; a área da Ciência da Computação foi a que mais produziu, e constitui uma tendência em sua interdisciplinaridade com as ciências biológicas e da saúde. Conclui-se que, a partir da consciência de que a qualidade de dados é um parâmetro relativo, a implementação de serviços de gestão de dados de pesquisa deve passar por preparação com foco no atendimento a requisitos como os concernentes ao domínio e aos usos pretendidos.@pt


Research data management is recognized by the scientific community as an important part of best practices in research, so that these data should be available for access and reuse. Within the context of research data management, data curation and data quality are understood as strategic elements. This work aims to characterize and specify the existing scientific production on the theme “data quality in research data management” through the measurement of bibliometric indicators. In methodological terms, this research has a quantitative and qualitative nature, is exploratory in its objectives and uses the Web of Science and Scopus databases to compose the corpus of the bibliometric study. As a result, it was identified from a corpus of 77 articles a period of relevant publications between the years 1984 and 2020, being 2019 the year with more published works. Additionally, 7 publication vehicles presented more than one publication for the researched topic, being the United States the country with more published papers, totaling 34 articles. The area of Computer Science was the one that produced the most on this topic and constitutes a trend in its interdisciplinarity with biological, applied social and health sciences. Finally, we conclude that, based on the awareness that data quality is a relative parameter, the implementation of research data management services must go through preparation, focusing on meeting requirements such as those concerning the domain and the intended uses.@en

. Qualidade de dados em gestão de dados de pesquisa: um estudo bibliométrico. Em questão, [????].

References

  • BATINI, C. et al. Methodologies for data quality assessment and improvement. ACM Computing Surveys, Nova York, v. 41, n. 3, p. 1-52, 2009.
  • BATINI, C.., SCANNAPIECO, M. Data and information quality: dimensions, principles and techniques. [S. l.]: Springer, 2016.
  • BORGMAN, C. L Research data: who will share what, with whom, when and why?. RatSWD Working Paper Series, Berlim, v. 161, n. 10, 2010.
  • BRASE, J., FARQUHAR, A. Access to research data. D-Lib Magazine, [s. l.], v. 17, n. 1/2, 2011.
  • BUFREM, L.., PRATES, Y. O saber científico registrado e as práticas de mensuração da informação. Ciência da Informação, Brasília, v. 34, n. 2, p. 925, 2005.
  • DIGITAL CURATION CENTRE. History of the DCC. DCC, 2021.
  • GABRIEL JUNIOR, R. F. et al. Acesso aberto a dados de pesquisa no Brasil: mapeamento de repositórios, práticas e percepções dos pesquisadores e tecnologias. Ciência da Informação, Brasília, v. 48, n. 3 (Supl.), p. 87-101, 2019.
  • HACID, H. et al.Data quality and trust in big data. [S. l.]: Springer, 2019.
  • HUANG, H. et al. Prioritization of data quality dimensions and skills requirements in genome annotation work. Journal of the American Society for Information Science and Technology, [Silver Spring], v. 63, n. 1, p. 195-207, 2012.
  • ILLARI, P.., FLORIDI, L. Information quality, data and philosophy. In: FLORIDI, L.., ILLARI, P. (Eds.). The philosophy of information quality. Cham: Springer, 2014. p. 5-23.
  • KITCHENHAM, B. Procedures for performing systematic reviews. Keele University Technical Report, Keele, v. 33, p. 1-26, jul. 2004.
  • KOLTAY, T. Data governance, data literacy and the management of data quality. IFLA Journal, [s.l.], v. 42, n. 4, p. 303-312, 2016.
  • LAUDON, K. C. Data quality and due process in large interorganizational record systems. Communications of the ACM, Nova York, v. 29, n. 1, p. 4-11, 1986.
  • LÓSCIO, B. F.., BURLE, C.., CALEGARI, N. Data on the Web best practices. W3C, 2017.
  • MARÍN-ARRAIZA, P.., PUERTA-DÍAZ, M.., VIDOTTI, S. A. B. G. Gestión de datos de investigación y bibliotecas: preservando los nuevos bienes científicos. Hypertext.net, Barcelona, n. 19, p. 13-31, 2019.
  • MELO, J. O. S. F.., BOTEGA, L. C.., SANTAREM SEGUNDO, J. E. Metodologia de avaliação de qualidade para dados conectados. Informação and Tecnologia, Marília/João Pessoa, v. 4, n. 2, p. 80-101, 2017.
  • OLIVER, G.., HARVEY, D. R. Digital curation. Chicago: ALA Neal-Schuman, 2010.
  • RAJAN, N. S. et al. Towards a content agnostic computable knowledge repository for data quality assessment. Computer Methods and Programs in Biomedicine, [s. l.], v. 177, p. 193-201, 2019.
  • RICE, R.., SOUTHALL, J. The data librarian’s handbook. London: Facet Publishing, 2016.
  • SALES, L. F. et al. Competências dos bibliotecários na gestão dos dados de pesquisa. Ciência da Informação, Brasília, v. 48, n. 3 (Supl.), p. 303-313,
  • SALES, L. F.., SAYÃO, L. F. Há futuro para as bibliotecas de pesquisa no ambiente e Science? Informação and Tecnologia, Marília/João Pessoa, v. 2, n. 1, p. 30-52, 2015.
  • SALES, L. F.., SAYÃO, L. F. Uma proposta de taxonomia para dados de pesquisa. Conhecimento em Ação, Rio de Janeiro, v. 4, n. 1, p. 31-48, 2019.
  • SANT’ANA, R. C. G. Campo informacional resultante da interação de ciclos de vida dos dados. In: DIAS, G. A.., OLIVEIRA, B. M. J. F. Dados científicos: perspectivas e desafios. João Pessoa: Ed. UFPB, 2019. p. 13-31.
  • SANTOS, P. L. V. A. C.., SANT’ANA, R. C. G. Dado e granularidade na perspectiva da informação e tecnologia: uma interpretação pela Ciência da Informação. Ciência da Informação, Brasília, v. 42, n. 2, p. 199-209, 2013.
  • SAYÃO, L. F.., SALES, L. F. Algumas considerações sobre os repositórios digitais de dados de pesquisa. Informação and Informação, Londrina, v. 21, n. 2, p. 90-115, 2016.
  • SAYÃO, L. F.., SALES, L. F. Curadoria digital: um novo patamar para preservação de dados digitais de pesquisa. Informação and Sociedade: Estudos, João Pessoa, v. 22, n. 3, p. 179-191, 2012.
  • SAYÃO, L. F.., SALES, L. F. Guia de gestão de dados de pesquisa para bibliotecários e pesquisadores. Rio de Janeiro: CNEN, 2015.
  • SAYÃO, L. F.., SALES, L. F. Subsídios para a construção de um modelo de avaliação de sistemas de gestão de dados de pesquisa. PontodeAcesso, Salvador, v. 12, n. 3, p. 80-108, 2018.
  • SILVA, L. C.., SANTAREM SEGUNDO, J. E.., SILVA, M. F. Princípios FAIR e melhores práticas do Linked Data na publicação de dados de pesquisa. Informação and Tecnologia (ITEC), Marília/João Pessoa, v. 5, n. 2, p. 81-103, 2018.
  • STVILIA, B. et al. Research project tasks, data, and perceptions of data quality in a condensed matter physics community. Journal of the Association for Information Science and Technology, Silver Spring, v. 66, n. 2, p. 246-263, 2015.
  • TARTAROTTI, R. C. D.., DAL´EVEDOVE, P. R.., FUJITA, M. S. L. Biblioteconomia de dados em repositórios de pesquisa: perspectivas para a atuação bibliotecária. Informação and Informação, Londrina, v. 24, n. 3, p. 207226, 2019.
  • TENOPIR, C. et al. Changes in data sharing and data reuse practices and perceptions among scientists worldwide. PLoS One, São Francisco, v. 10, n. 8, p. 1-24, 2015.
  • TORINO, E.., ROA-MARTÍNEZ, S. M.., VIDOTTI, S. A. B. G. Dados de pesquisa: disponibilização ou publicação?. In: SHINTAKU, M.., SALES, L. F.., COSTA, M. (Org.). Repositórios digitais: teoria e prática. Botucatu: ABEC, 2020. p. 183-201.
  • WALLIS, J. C. et al. Know thy sensor: trust, data quality, and data integrity in scientific digital libraries. In: KOVÁCS, L.., FUHR, N.., MEGHINI, C. (Eds.). Research and advanced technology for digital libraries (Lecture Notes in Computer Science, v. 4675). Berlin: Springer, 2007. p. 380-391.
  • WILKINSON, M. D. et al. The FAIR guiding principles for scientific data management and stewardship. Scientific Data, Londres, v. 3, artigo n. 60018, 2016.
NLP0.29
Visto 21 vezes
sem referências
Array
(
    [dateOfAvailability] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [2021-10-25] => 165197
                        )

                )

        )

    [hasAuthor] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Daiane Marcela Piccolo] => 109132
                        )

                    [1] => Array
                        (
                            [Antonio Victor Wolf Tadini] => 27004
                        )

                    [2] => Array
                        (
                            [Heytor Diniz Teixeira] => 105816
                        )

                    [3] => Array
                        (
                            [Leonardo Castro Botega] => 35947
                        )

                    [4] => Array
                        (
                            [Ricardo César Gonçalves Sant’ana] => 201886
                        )

                    [5] => Array
                        (
                            [José eduardo santarem segundo] => 11021
                        )

                    [6] => Array
                        (
                            [Rachel Cristina Vesu Alves] => 3423
                        )

                )

        )

    [hasFileStorage] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [_repository/47/2021/11/oai_seer_ufrgs_br_article_112240#00002.pdf] => 166546
                        )

                )

        )

    [hasSectionOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Artigo] => 3
                        )

                )

        )

    [hasSubject] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciëncia social aplicada] => 2102
                        )

                    [1] => Array
                        (
                            [Ciência da informação] => 237157
                        )

                    [2] => Array
                        (
                            [Gestão de dados de pesquisa] => 266737
                        )

                    [3] => Array
                        (
                            [Qualidade de dado] => 15822
                        )

                    [4] => Array
                        (
                            [Dados de pesquisa] => 268438
                        )

                    [5] => Array
                        (
                            [Dado científico] => 32379
                        )

                    [6] => Array
                        (
                            [Curadoria digital] => 234104
                        )

                    [7] => Array
                        (
                            [Qualidade de dados] => 256902
                        )

                    [8] => Array
                        (
                            [Dados científicos] => 200509
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Research data management] => 126248
                        )

                    [1] => Array
                        (
                            [Data quality] => 265528
                        )

                    [2] => Array
                        (
                            [Research data] => 188323
                        )

                    [3] => Array
                        (
                            [Scientific data] => 268437
                        )

                    [4] => Array
                        (
                            [Digital curation] => 267795
                        )

                )

        )

    [wasPublicationInDate] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [2021-12-07] => 232832
                        )

                )

        )

    [hasLanguageExpression] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [pt] => 232736
                        )

                )

        )

    [hasLicense] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Copyright (c)] => 232755
                        )

                    [1] => Array
                        (
                            [CCBY4.0] => 232756
                        )

                )

        )

    [isPartOfSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Em questão] => 47
                        )

                )

        )

    [hasIssueOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:00002-2021--ONLINE] => 156645
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:2: 2022-28-1] => 232496
                        )

                )

        )

    [hasAbstract] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [A gestão dos dados de pesquisa é reconhecida pela comunidade científica como parte importante das boas práticas de pesquisa, de modo que esses dados devem estar disponíveis para acesso e reuso. No âmbito da gestão dos dados de pesquisa, a curadoria e a qualidade de dados são entendidos como elementos estratégicos. Este trabalho tem como objetivo mensurar a produção científica existente sobre o tema “qualidade de dados em gestão de dados de pesquisa”, por meio da aferição de indicadores bibliométricos. Em termos metodológicos, possui natureza quantitativa e qualitativa, é exploratório quanto a seus objetivos e utiliza-se das bases de dados Web of Science e Scopus para composição do corpus do estudo bibliométrico. Como resultado, identificou-se a partir de um corpus de 77 artigos, que o período com publicações se estende entre os anos de 1984 e 2020, sendo 2019 aquele no qual mais trabalhos foram publicados, com 13 publicações; 7 veículos de publicação apresentaram mais de uma publicação para o tópico pesquisado; os Estados Unidos são o país com mais trabalhos publicados, totalizando 34 artigos; a área da Ciência da Computação foi a que mais produziu, e constitui uma tendência em sua interdisciplinaridade com as ciências biológicas e da saúde. Conclui-se que, a partir da consciência de que a qualidade de dados é um parâmetro relativo, a implementação de serviços de gestão de dados de pesquisa deve passar por preparação com foco no atendimento a requisitos como os concernentes ao domínio e aos usos pretendidos.] => 0
                        )

                    [1] => Array
                        (
                            [A gestão dos dados de pesquisa é reconhecida pela comunidade científica como parte importante das boas práticas de pesquisa. Desta maneira, acredita-se que os mesmos devem estar sempre disponíveis para acesso e reuso. Neste contexto, a curadoria e a qualidade de dados são entendidas como elementos estratégicos. Este trabalho tem como objetivo caracterizar e especificar a produção científica existente sobre o tema “qualidade de dados em gestão de dados de pesquisa”, por meio da aferição de indicadores bibliométricos. Em termos metodológicos, esta pesquisa possui natureza quantitativa e qualitativa, é de tipo exploratória quanto a seus objetivos e utilizasse das bases de dados Web of Science e Scopus para a composição do corpus do estudo bibliométrico. Como resultado, identificou-se, a partir de um corpus de 77 artigos, um período de publicações relevantes entre os anos de 1984 e 2020, sendo o ano de 2019 aquele com mais trabalhos publicados. Adicionalmente, 7 veículos de publicação apresentaram mais de um artigo no tópico pesquisado, sendo os Estados Unidos o país com mais trabalhos publicados, totalizando 34. A área da Ciência da Computação foi a que mais produziu nesse tema e constitui uma tendência em sua interdisciplinaridade com as ciências biológicas, sociais aplicadas e da saúde. Finalmente, conclui-se que, a partir da consciência de que a qualidade de dados é um parâmetro relativo, a implementação de serviços de gestão de dados de pesquisa deve passar por preparação, com foco no atendimento a requisitos como os concernentes ao domínio e aos usos pretendidos.] => 0
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Research data management is recognized by the scientific community as an important part of best practices in research, so that these data should be available for access and reuse. Within the context of research data management, data curation and data quality are understood as strategic elements. This work aims to characterize and specify the existing scientific production on the theme “data quality in research data management” through the measurement of bibliometric indicators. In methodological terms, this research has a quantitative and qualitative nature, is exploratory in its objectives and uses the Web of Science and Scopus databases to compose the corpus of the bibliometric study. As a result, it was identified from a corpus of 77 articles a period of relevant publications between the years 1984 and 2020, being 2019 the year with more published works. Additionally, 7 publication vehicles presented more than one publication for the researched topic, being the United States the country with more published papers, totaling 34 articles. The area of Computer Science was the one that produced the most on this topic and constitutes a trend in its interdisciplinarity with biological, applied social and health sciences. Finally, we conclude that, based on the awareness that data quality is a relative parameter, the implementation of research data management services must go through preparation, focusing on meeting requirements such as those concerning the domain and the intended uses.] => 0
                        )

                )

        )

    [hasID] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [oai:seer.ufrgs.br:article/112240] => 0
                        )

                )

        )

    [hasRegisterId] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/view/112240] => 0
                        )

                    [1] => Array
                        (
                            [10.19132/1808-524500.%p] => 0
                        )

                )

        )

    [hasSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Em Questão; Online first] => 0
                        )

                    [1] => Array
                        (
                            [1808-5245] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [1807-8893] => 0
                        )

                )

        )

    [hasTitle] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Qualidade de dados em gestão de dados de pesquisa: um estudo bibliométrico] => 0
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Data quality in research data management: a bibliometric study] => 0
                        )

                )

        )

    [hasUrl] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/view/112240/64988] => 0
                        )

                    [1] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/112240/64356] => 0
                        )

                    [2] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/112240/64357] => 0
                        )

                    [3] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/112240/64358] => 0
                        )

                    [4] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/112240/64359] => 0
                        )

                    [5] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/112240/64360] => 0
                        )

                    [6] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/112240/64418] => 0
                        )

                    [7] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/112240/69033] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [https://seer.ufrgs.br/index.php/EmQuestao/article/view/112240] => 0
                        )

                    [1] => Array
                        (
                            [https://seer.ufrgs.br/index.php/EmQuestao/article/view/112240/64988] => 0
                        )

                )

        )

    [prefLabel] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Oai:seer.ufrgs.br:article/112240#00002] => 0
                        )

                )

        )

    [hasDOI] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [10.19132/1808-5245281.159-184] => 0
                        )

                )

        )

)