Article Brapci-Revistas

Análise do processo de recuperação da informação em bases de dados publicadas como dados abertos ligados utilizando a abordagem RDB2LOD

Analysis of the information retrieval process in databases published as linked open data using the RDB2LOD approach

Os dados abertos ligados têm se tornado um padrão para publicação e enriquecimento de dados, o que promove a transição de uma Web orientada a documentos para uma Web de dados e, por conseguinte, para a Web Semântica. Por outro lado, bases de dados relacionais compõem o núcleo da maioria dos sistemas de informação atualmente em operação. Assim, a publicação da imensa quantidade de dados mantidos em bases de dados relacionais, seguindo as boas práticas e recomendações do Linked Data, pode contribuir significativamente para a consolidação das ferramentas e tecnologias da Web Semântica. É nesse contexto que surgiu a abordagem RDB2LOD para publicação de dados abertos ligados obtidos a partir de bases de dados relacionais. Porém, depois de os dados serem efetivamente publicados, o passo seguinte é recuperá-los de forma eficiente para o seu devido consumo. Este trabalho, de natureza qualitativa e do tipo exploratório, tem como objetivo fazer uma análise do processo de recuperação da informação na abordagem RDB2LOD, a fim de averiguar se a utilização desta abordagem pode facilitar a formulação de consultas SPARQL e, consequentemente, melhorar a visualização e exploração dos dados recuperados. Para isso foi realizada uma pesquisa bibliográfica e documental, além de um experimento no qual a abordagem teve seu processo de recuperação da informação avaliado em dois casos distintos. Ficou demonstrado que, ao levar em consideração os aspectos semânticos dos termos empregados nas expressões de consulta, por meio da aplicação de ontologias, é possível tornar mais eficiente e precisa a recuperação de dados.@pt


Linked Open Data has become a standard for data publishing and data enrichment, and it supports the transition from a document-driven Web to an interconnected Web of data and thus to the Semantic Web. On the other hand, relational databases make up the core of most information systems currently in operation due to their maturity and efficiency in the form of storing and querying data. Thus, publishing the vast amount of data maintained in relational databases around the world in line with the good practices and recommendations of Linked Data can contribute significantly to the widespread adoption of Semantic Web tools and technologies. It is in this context that appeared the RDB2LOD approach for publishing Linked Open Data obtained from relational databases. However, once data is effectively published, the next step is efficiently and accurately searching and retrieving it for suitable use. This qualitative and exploratory work aims to analyze the information retrieval process in the RDB2LOD approach, in order to find out if the use of this approach can help to formulate SPARQL queries and, consequently, to improve the visualization and exploration of the retrieved data. For this, a bibliographic and documentary study was carried out, along with an experiment where the RDB2LOD approach’s information retrieval process was evaluated in two different cases. It was demonstrated that the consideration of the semantic aspects of terms in query expressions and the application of ontologies might improve data retrieval efficiency and accuracy.@en

. Análise do processo de recuperação da informação em bases de dados publicadas como dados abertos ligados utilizando a abordagem rdb2lod analysis of the information retrieval process in databases published as linked open data using the rdb2lod approach. Em questão, [????].

References

  • BERNERS-LEE, T.., HENDLER, J.., LASSILA, O. The semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, New York, v. 284, p. 28-37, 2001.
  • CONEGLIAN, C. S. et al. O papel estratégico da Web Semântica no contexto do big data. In: WORKSHOP DE INFORMAÇÃO, DADOS E TECNOLOGIA, 1., 2017, Florianópolis. Anais [...]. Florianópolis: UFSC, 2017. p. 1-6.
  • CRISTOVÃO, H. M.., FERNANDES, J. H. C. Recuperação de informação em dados ligados: um modelo baseado em mapas conceituais e análise de redes complexas. Transinformação, Campinas, v. 30, n. 2, p. 193-207, 2018.
  • CUBA RODRÍGUEZ, Y.., OLIVERA BATISTA, D. Los metadatos, la búsqueda y recuperación de información desde las Ciencias de la Información. e-Ciencias de la Información, San José, v. 8, n. 2, p. 3-13, 2018.
  • DEVI, R.., MEHROTRA, D.., BAAZAOUI-ZGHAL, H. Pubworld - A R2RML mapping driven approach to transform relational database data into shareable format. In: INSTITUTE OF ELECTRICAL AND ELETRONICS ENGINEERS INTERNATIONAL ADVANCE COMPUTING CONFERENCE, 8., 2018, Greater Noida. Proceedings […]. Piscataway: IEEE, 2018. p. 221-227.
  • FERNÁNDEZ, M. et al. Semantically enhanced Information Retrieval: an ontology-based approach. Journal of Web Semantics, Amsterdam, v. 9, n. 4, p. 434-452, 2011.
  • FERNEDA, E. Material da disciplina Recuperação de Informação: técnicas e tecnologias. Marília: Unesp, 2019. 1 diapositivo. Acesso em: 6 set. 2019.
  • GONZALEZ, M.., LIMA, V. L. S. Recuperação de Informação e Processamento da Linguagem Natural. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO, 23., 2003, Campinas. Anais [...]. Porto Alegre: SBC, 2003. p. 347-395.
  • LANTI, D.., XIAO, G.., CALVANESE, D. VIG: Data scaling for OBDA benchmarks. Semantic Web, Amsterdam, v. 10, n. 2, p. 413-433, 2019.
  • LAUFER, C. Guia de Web semântica. São Paulo: Projeto SPUK, 2015.
  • LIDDY, E. D. Enhanced Text retrieval using natural language processing. Bulletin of the American Society for Information Science and Technology, New Jersey, v. 24, n. 4, p. 14-16, 1998.
  • LING, H.., ZHOU, S. Translating relational databases into RDF. In: INTERNATIONAL CONFERENCE ON ENVIRONMENTAL SCIENCE AND INFORMATION APPLICATION TECHNOLOGY, 2., 2010, Wuhan. Proceedings [...]. Piscataway: IEEE, 2010. p. 464-467.
  • PABÓN, O. S.., GONZÁLEZ, M. E. del S. M. Propuesta para extender semánticamente el proceso de recuperación de información. Escuela de ingenieria de Antioquia, Envigado, v. 11, n. 22, p. 51-65, 2014.
  • PATEL, A.., JAIN, S. Present and future of semantic web technologies: a research statement. International Journal of Computers and Applications, Abingdon, p. 1-10, 2019.
  • PEREIRA, C. M. Uma abordagem para a publicação de dados abertos ligados obtidos a partir de bases de dados relacionais. 2012. Dissertação (Mestrado em Informática) - Curso de Pós-Graduação em Engenharia Eletrônica e Computação, Instituto Tecnológico de Aeronáutica, São José dos Campos, 2012.
  • SANTAREM SEGUNDO, J. E.., CONEGLIAN, C. S. Web semântica e Ontologias: um estudo sobre construção de axiomas e uso de inferências. Informação and Informação, Londrina, v. 21, n. 2, p. 217-244, 2016.
  • SANTAREM SEGUNDO, J. E. Web semântica: fluxo para publicação de dados abertos e ligados. Informação em Pauta, Fortaleza, v. 3, n. esp., p. 117-140, 2018.
  • SCHAIBLE, J.., GOTTRON, T.., SCHERP, A. Survey on common strategies of vocabulary reuse in Linked Open Data modeling. In: PRESUTTI, V.., D’AMATO, C.., GANDON, F.., D’AQUIN, M.., STAAB, S.., TORDAI, A. (ed.).
  • ESWC 2014: the Semantic Web: trends and challenges. Berlin: Springer, 2014. p. 457-472 (Lecture Notes in Computer Science, v. 8465).
  • SILVELLO, G. et al. Semantic representation and enrichment of information retrieval experimental data. International Journal of Digital Libraries, Berlin, v. 18, p. 145-172, 2017.
  • ULUTAŞ KARAKOL, D. et al. Semantic linking spatial RDF data to the web data sources. International Archives of Photogrammetry and Remote Sensing Spatial Information Science, Delft, v. XLII-4, p. 639-645, 2018.
NLP0.29
Visto 16 vezes
sem referências
Array
(
    [dateOfAvailability] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [2020-09-16] => 146068
                        )

                )

        )

    [hasAuthor] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Clayton Martins Pereira] => 5251
                        )

                    [1] => Array
                        (
                            [Edberto Ferneda] => 6437
                        )

                    [2] => Array
                        (
                            [José eduardo santarem segundo] => 11021
                        )

                )

        )

    [hasFileStorage] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [_repository/47/2020/09/oai_seer_ufrgs_br_article_98764#00002.pdf] => 146346
                        )

                )

        )

    [hasPageEnd] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [120] => 1162
                        )

                )

        )

    [hasPageStart] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [94] => 455
                        )

                )

        )

    [hasSectionOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Artigo] => 3
                        )

                )

        )

    [hasSubject] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciëncia social aplicada] => 2102
                        )

                    [1] => Array
                        (
                            [Ciência da informação] => 237157
                        )

                    [2] => Array
                        (
                            [Recuperação da informação] => 261956
                        )

                    [3] => Array
                        (
                            [Base de dado relacional] => 146161
                        )

                    [4] => Array
                        (
                            [Dados ligados] => 176989
                        )

                    [5] => Array
                        (
                            [Dado aberto ligado] => 146162
                        )

                    [6] => Array
                        (
                            [Web semântica] => 201822
                        )

                    [7] => Array
                        (
                            [Bases de dados relacionais] => 268207
                        )

                    [8] => Array
                        (
                            [Dados abertos ligados] => 269982
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Information retrieval] => 227532
                        )

                    [1] => Array
                        (
                            [Relational databases] => 268208
                        )

                    [2] => Array
                        (
                            [Linked data] => 261378
                        )

                    [3] => Array
                        (
                            [Linked open data] => 249834
                        )

                    [4] => Array
                        (
                            [Semantic web] => 171946
                        )

                )

        )

    [wasPublicationInDate] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [2020-09-16] => 244004
                        )

                )

        )

    [hasLanguageExpression] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [pt] => 232736
                        )

                )

        )

    [hasLicense] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Copyright (c)] => 232755
                        )

                    [1] => Array
                        (
                            [CCBY4.0] => 232756
                        )

                )

        )

    [isPartOfSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Em questão] => 47
                        )

                )

        )

    [hasIssueOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:00002-2020-26-3] => 146065
                        )

                )

        )

    [hasAbstract] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Os dados abertos ligados têm se tornado um padrão para publicação e enriquecimento de dados, o que promove a transição de uma Web orientada a documentos para uma Web de dados e, por conseguinte, para a Web Semântica. Por outro lado, bases de dados relacionais compõem o núcleo da maioria dos sistemas de informação atualmente em operação. Assim, a publicação da imensa quantidade de dados mantidos em bases de dados relacionais, seguindo as boas práticas e recomendações do Linked Data, pode contribuir significativamente para a consolidação das ferramentas e tecnologias da Web Semântica. É nesse contexto que surgiu a abordagem RDB2LOD para publicação de dados abertos ligados obtidos a partir de bases de dados relacionais. Porém, depois de os dados serem efetivamente publicados, o passo seguinte é recuperá-los de forma eficiente para o seu devido consumo. Este trabalho, de natureza qualitativa e do tipo exploratório, tem como objetivo fazer uma análise do processo de recuperação da informação na abordagem RDB2LOD, a fim de averiguar se a utilização desta abordagem pode facilitar a formulação de consultas SPARQL e, consequentemente, melhorar a visualização e exploração dos dados recuperados. Para isso foi realizada uma pesquisa bibliográfica e documental, além de um experimento no qual a abordagem teve seu processo de recuperação da informação avaliado em dois casos distintos. Ficou demonstrado que, ao levar em consideração os aspectos semânticos dos termos empregados nas expressões de consulta, por meio da aplicação de ontologias, é possível tornar mais eficiente e precisa a recuperação de dados.] => 0
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Linked Open Data has become a standard for data publishing and data enrichment, and it supports the transition from a document-driven Web to an interconnected Web of data and thus to the Semantic Web. On the other hand, relational databases make up the core of most information systems currently in operation due to their maturity and efficiency in the form of storing and querying data. Thus, publishing the vast amount of data maintained in relational databases around the world in line with the good practices and recommendations of Linked Data can contribute significantly to the widespread adoption of Semantic Web tools and technologies. It is in this context that appeared the RDB2LOD approach for publishing Linked Open Data obtained from relational databases. However, once data is effectively published, the next step is efficiently and accurately searching and retrieving it for suitable use. This qualitative and exploratory work aims to analyze the information retrieval process in the RDB2LOD approach, in order to find out if the use of this approach can help to formulate SPARQL queries and, consequently, to improve the visualization and exploration of the retrieved data. For this, a bibliographic and documentary study was carried out, along with an experiment where the RDB2LOD approach’s information retrieval process was evaluated in two different cases. It was demonstrated that the consideration of the semantic aspects of terms in query expressions and the application of ontologies might improve data retrieval efficiency and accuracy.] => 0
                        )

                    [1] => Array
                        (
                            [Linked Open Data has become a standard for data publishing and data enrichment, and it supports the transition from a document-driven Web to an interconnected Web of data and thus to the Semantic Web. On the other hand, relational databases make up the core of most information systems currently in operation due to their maturity and efficiency in the form of storing and querying data. Thus, publishing the vast amount of data maintained in relational databases around the world in line with the good practices and recommendations of Linked Data can contribute significantly to the widespread adoption of Semantic Web tools and technologies. It is in this context that appeared the RDB2LOD approach for publishing Linked Open Data obtained from relational databases. However, once data is effectively published, the next step is efficiently and accurately searching and retrieving it for suitable use. This qualitative and exploratory work aims to analyze the information retrieval process in the RDB2LOD approach, in order to find out if the use of this approach can help to formulate SPARQL queries and, consequently, to improve the visualization and exploration of the retrieved data. For this, a bibliographic and documentary study was carried out, along with an experiment where the RDB2LOD approach’s information retrieval process was evaluated in two different cases. It was demonstrated that the consideration of the semantic aspects of terms in query expressions and the application of ontologies might improve data retrieval efficiency and accuracy.] => 0
                        )

                )

        )

    [hasID] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [oai:seer.ufrgs.br:article/98764] => 0
                        )

                )

        )

    [hasRegisterId] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/view/98764] => 0
                        )

                    [1] => Array
                        (
                            [10.19132/1808-5245263.94-120] => 0
                        )

                )

        )

    [hasSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Em Questão; v. 26, n. 3, set/dez. 2020; 94-120] => 0
                        )

                    [1] => Array
                        (
                            [1808-5245] => 0
                        )

                    [2] => Array
                        (
                            [Em Questão; v. 26, n. 3, set./dez. 2020; 94-120] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [1807-8893] => 0
                        )

                )

        )

    [hasTitle] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Análise do processo de recuperação da informação em bases de dados publicadas como dados abertos ligados utilizando a abordagem RDB2LOD] => 0
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Analysis of the information retrieval process in databases published as linked open data using the RDB2LOD approach] => 0
                        )

                )

        )

    [hasUrl] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/view/98764/57829] => 0
                        )

                    [1] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53169] => 0
                        )

                    [2] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53170] => 0
                        )

                    [3] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53171] => 0
                        )

                    [4] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53172] => 0
                        )

                    [5] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53173] => 0
                        )

                    [6] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53174] => 0
                        )

                    [7] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53175] => 0
                        )

                    [8] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53176] => 0
                        )

                    [9] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53177] => 0
                        )

                    [10] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53178] => 0
                        )

                    [11] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53179] => 0
                        )

                    [12] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53180] => 0
                        )

                    [13] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53181] => 0
                        )

                    [14] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/53182] => 0
                        )

                    [15] => Array
                        (
                            [https://seer.ufrgs.br/EmQuestao/article/downloadSuppFile/98764/59157] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [https://seer.ufrgs.br/index.php/EmQuestao/article/view/98764] => 0
                        )

                    [1] => Array
                        (
                            [https://seer.ufrgs.br/index.php/EmQuestao/article/view/98764/57829] => 0
                        )

                )

        )

    [prefLabel] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Oai:seer.ufrgs.br:article/98764#00002] => 0
                        )

                )

        )

    [hasDOI] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [10.19132/1808-5245263.94-120] => 0
                        )

                )

        )

)