Article Brapci-Revistas

Tecnologias da web semântica para a recuperação da informação no wikidata

Semantic web technologies for the information retrieval on wikidata

A Recuperação da Informação é responsável pelo armazenamento e pela recuperação automática de informação, podendo estes documentos ser constituídos por textos, páginas Web, áudio, vídeo, imagens, gráficos e figuras. Técnicas de Recuperação de Informação ganharam importância com o crescimento da Web, pois a quantidade ilimitada de informação pode expressar as mais diversas formas e níveis de qualidade ao que se espera. Pensando nisso o presente trabalho estuda métodos e tecnologias capazes de recuperar essas informações, dando enfoque a buscar em bases de dados estruturadas chamadas Linked Data, mas especificamente no Wikidata, uma base de dados estruturada utilizando conceitos da Web Semântica, que reúne conhecimentos da Wikipédia. Buscando compreender como é feita essa recuperação da informação no projeto Wikidata, esta pesquisa tem como objetivo apresentar os meios que o Wikidata fornece para a RI e como eles usam os princípios da Web Semântica. A metodologia utilizada foi um estudo exploratório com embasamento para a pesquisa e aplicada, uma vez que testes foram feitos na base de dados do Wikidata. Como resultados, identificou-se características das diversas formas de acesso e de recuperação dos dados, traçando correlações existentes entre cada uma destas formas, com o arcabouço teórico da Web Semântica e da Recuperação da Informação. Concluiu-se que o Wikidata se coloca como uma base de dados sólida, com um grande volume de conteúdo que possui uma série de mecanismos de recuperação, capazes de atender às mais diversas aplicações existentes na Web, devido a estes mecanismos serem construídos com distintas tecnologias e configurações.@pt


Information Retrieval is responsible for the storage and automatic retrieval of information, and these documents may consist of texts, web pages, audio, video, images, graphics and figures. Information Retrieval techniques have gained importance with the growth of the Web, because the unlimited amount of information can express the most diverse forms and levels of quality to what is expected. With this in mind, the present work studies methods and technologies capable of retrieving this information, focusing on searching structured databases called Linked Data, but specifically on the Wikidata project, a database structured using Semantic Web concepts, which brings together the knowledge from Wikipedia. Seeking to understand how this information retrieval is done in the Wikidata project, this research has the objective of presenting the media that Wikidata provides to RI and how they use the principles of the Semantic Web. The methodology used was an exploratory study based on the research and applied, since tests were done in the database of Wikidata. As a result, the characteristics of the various forms of data access and retrieval were identified, tracing the correlations between each of these forms, with the theoretical framework of the Semantic Web and Information Retrieval. It was concluded that Wikidata stands as a solid database, with a large volume of contents, quite current, that has a series of recovery mechanisms, capable of serving the most diverse applications on the Web, because these mechanisms are built with different technologies and configurations.@en

. Tecnologias da web semântica para a recuperação da informação no wikidata. Revista digital de biblioteconomia & ciência da informação, [????].

References

  • BERNERS-LEE, T.., HENDLER, J.., LASSILA, O. The semantic web. Scientific american, v. 284, n. 5, p. 28-37, 2001.
  • DZIEKANIAK, G.,V.., KIRINUS, J. B. Web Semântica. Semantic Web. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, n.18, 2º sem. 2004. Disponível em: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2004v9n18p20. Acesso em: 31 jan. 2018.
  • SANTAREM SEGUNDO, J. E.., SOUZA, J. O.., CONEGLIAN, C. S. Web semântica: introdução a recursos de visualização de dados em formatos gráficos. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 15., João Pessoa, PB. 2015. Anais eletrônicos... João Pessoa, PB: ANCIB, 2015. Disponível em: [20] http://www.ufpb.br/evento/lti/ocs/index.php/enancib2015/enancib2015/paper/view/2780. Acesso em: 2 fev. 2018.
  • SANT’ANA, R. C. G. A importância do papel do profissional da ciência da informação nos processos de recuperação de conteúdos digitais estruturados. In: GUIMARÃES, José Augusto Chaves., FUJITA, Mariângela Spotti Lopes (Org.). Ensino e pesquisa em biblioteconomia no Brasil: a emergência de um novo olhar. Marília: Cultura acadêmica, 2008. p. 145-154.
  • SILBERCHATZ, A.., KORTH, H. F.., SADARSHAN S. Sistema de banco de dados. 6° edição traduzida. Editora Elservier. 2012.
  • WIKIDATA QUERY API. Query construction. 2017. Disponível em: https://wdq.wmflabs.org/api_documentation.html. Acesso em: 27 jan. 2018
  • WIKIDATA. Wikidata: robôs. 2017b. Disponível em: https://www.wikidata.org/wiki/Wikidata:Bots/pt-br. Acesso em: 27 jan. 2018.
  • WIKIDATA. Wikidata: acesso aos dados. 2016. Disponível em: https://www.wikidata.org/wiki/Wikidata:Data_access/pt-br. Acesso em: 25 jan. 2018.
  • W3C. Web semântica. 2015. Disponível em: http://www.w3c.br/Padroes/WebSemantica. Acesso em: 31 jan. 2018.
  • W3C. SPARQL query language for RDF. 2008. Disponível em: https://www.w3.org/TR/rdf-sparql-query/. Acesso em: 31 jan. 2018
  • W3C. OWL: web ontology language (OWL). 2012. Disponível em: https://www.w3.org/OWL/. Acesso em: 31 mar. 2017
  • W3C. Extensible Markup Language. 2015. Disponível em: https://www.w3.org/XML/. Acesso em: 30 jan. 2018. This work is licensed under a Creative Commons Attribution 4.0 United States License. This journal is published by the University Library System of the University of Pittsburgh as part of its D-Scribe Digital Publishing Program and is cosponsored by the University of Pittsburgh Press.
NLP0.29
Visto 16 vezes
sem referências
Array
(
    [dateOfAvailability] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [2018-11-05] => 105826
                        )

                )

        )

    [hasAuthor] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Larissa Pavarini Luz] => 104938
                        )

                    [1] => Array
                        (
                            [Caio Saraiva Congelian] => 106161
                        )

                    [2] => Array
                        (
                            [José eduardo santarem segundo] => 11021
                        )

                )

        )

    [hasFileStorage] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [_repository/285/2018/11/oai_ojs_periodicos_sbu_unicamp_br_article_8651791#00017.pdf] => 105833
                        )

                    [1] => Array
                        (
                            [_repository/285/2020/04/oai_ojs_periodicos_sbu_unicamp_br_article_8651791#00017.pdf] => 139442
                        )

                )

        )

    [hasSectionOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Artigo] => 3
                        )

                )

        )

    [hasSubject] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciência da informação] => 237157
                        )

                    [1] => Array
                        (
                            [Web semântica] => 201822
                        )

                    [2] => Array
                        (
                            [Recuperação da informação] => 261956
                        )

                    [3] => Array
                        (
                            [Linked data] => 207235
                        )

                    [4] => Array
                        (
                            [Wikidata] => 92779
                        )

                    [5] => Array
                        (
                            [Wikidata] => 265554
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Semantic web] => 171946
                        )

                    [1] => Array
                        (
                            [Information retrieval] => 227532
                        )

                    [2] => Array
                        (
                            [Linked data] => 261378
                        )

                    [3] => Array
                        (
                            [Wikidata] => 265555
                        )

                )

        )

    [wasPublicationInDate] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [2019-01-04] => 263102
                        )

                )

        )

    [hasLanguageExpression] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [pt] => 232736
                        )

                )

        )

    [isPartOfSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Revista Digital de Biblioteconomia & Ciência da Informação] => 285
                        )

                )

        )

    [hasIssueOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:00017-2019-1-] => 99416
                        )

                    [1] => Array
                        (
                            [ISSUE:JNL:00017-1900-17-2019] => 110297
                        )

                    [2] => Array
                        (
                            [ISSUE:JNL:00017-2019-17-] => 127023
                        )

                )

        )

    [hasAbstract] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [A Recuperação da Informação é responsável pelo armazenamento e pela recuperação automática de informação, podendo estes documentos ser constituídos por textos, páginas Web, áudio, vídeo, imagens, gráficos e figuras. Técnicas de Recuperação de Informação ganharam importância com o crescimento da Web, pois a quantidade ilimitada de informação pode expressar as mais diversas formas e níveis de qualidade ao que se espera. Pensando nisso o presente trabalho estuda métodos e tecnologias capazes de recuperar essas informações, dando enfoque a buscar em bases de dados estruturadas chamadas Linked Data, mas especificamente no Wikidata, uma base de dados estruturada utilizando conceitos da Web Semântica, que reúne conhecimentos da Wikipédia. Buscando compreender como é feita essa recuperação da informação no projeto Wikidata, esta pesquisa tem como objetivo apresentar os meios que o Wikidata fornece para a RI e como eles usam os princípios da Web Semântica. A metodologia utilizada foi um estudo exploratório com embasamento para a pesquisa e aplicada, uma vez que testes foram feitos na base de dados do Wikidata. Como resultados, identificou-se características das diversas formas de acesso e de recuperação dos dados, traçando correlações existentes entre cada uma destas formas, com o arcabouço teórico da Web Semântica e da Recuperação da Informação. Concluiu-se que o Wikidata se coloca como uma base de dados sólida, com um grande volume de conteúdo que possui uma série de mecanismos de recuperação, capazes de atender às mais diversas aplicações existentes na Web, devido a estes mecanismos serem construídos com distintas tecnologias e configurações.] => 0
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Information Retrieval is responsible for the storage and automatic retrieval of information, and these documents may consist of texts, web pages, audio, video, images, graphics and figures. Information Retrieval techniques have gained importance with the growth of the Web, because the unlimited amount of information can express the most diverse forms and levels of quality to what is expected. With this in mind, the present work studies
methods and technologies capable of retrieving this information, focusing on searching structured databases called Linked Data, but specifically on the Wikidata project, a database structured using Semantic Web concepts, which
brings together the knowledge from Wikipedia. Seeking to understand how this information retrieval is done in the Wikidata project, this research has the objective of presenting the media that Wikidata provides to RI and how they use the principles of the Semantic Web. The methodology used was an exploratory study based on the research and applied, since tests were done in the database of Wikidata. As a result, the characteristics of the various forms of data access and retrieval were identified, tracing the correlations between each of these forms, with the theoretical framework of the Semantic Web and Information Retrieval. It was concluded that Wikidata stands as a solid database, with a large volume of contents, quite current, that has a series of recovery mechanisms, capable of serving the most diverse applications on the Web, because these mechanisms are built with different technologies and configurations.] => 0
                        )

                )

        )

    [hasID] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [oai:ojs.periodicos.sbu.unicamp.br:article/8651791] => 0
                        )

                )

        )

    [hasRegisterId] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791] => 0
                        )

                    [1] => Array
                        (
                            [10.20396/rdbci.v1i0.8651791] => 0
                        )

                )

        )

    [hasSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação; v. 1 (2019): Publicação Contínua] => 0
                        )

                    [1] => Array
                        (
                            [1678-765X] => 0
                        )

                    [2] => Array
                        (
                            [RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação; v. 17 (2019): Publicação Contínua; e019003] => 0
                        )

                )

        )

    [hasTitle] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Tecnologias da web semântica para a recuperação da informação no wikidata] => 0
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Semantic web technologies for the information retrieval on wikidata] => 0
                        )

                )

        )

    [hasUrl] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf] => 0
                        )

                    [1] => Array
                        (
                            [https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/downloadSuppFile/8651791/2244] => 0
                        )

                    [2] => Array
                        (
                            [https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf_1] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791] => 0
                        )

                    [1] => Array
                        (
                            [https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf] => 0
                        )

                    [2] => Array
                        (
                            [https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf_1] => 0
                        )

                    [3] => Array
                        (
                            [https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/20317] => 0
                        )

                )

        )

    [prefLabel] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Oai:ojs.periodicos.sbu.unicamp.br:article/8651791#00017] => 0
                        )

                )

        )

    [hasDOI] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [10.20396/rdbci.v17i0.8651791] => 0
                        )

                )

        )

)