Article Brapci-Revistas

Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz

Data Science applied to arca: development and availability of tools for information retrieval in the Institutional Repository of Fundação Oswaldo cruz

ciencia de Datos aplicada al arca: desarrollo y disponibilización de herramientas para recuperación de la información en el Repositorio Institucional de la Fundação Oswaldo cruz

The Arca institutional repository is the main instrument of open access at the Oswaldo Cruz Foundation, with the mission of gathering, hosting, preserving, making available and giving visibility to the institution’s intellectual production. The thematic diversity and institutional complexity of the Foundation foster a methodological challenge related to the classification and retrieval of deposited digital objects and the governance of the metadata recorded by the communities that make up the repository. In 2016, the Arca search engine counted more than 400 thousand queries. An Information Retrieval system is needed that meets the specificities of indexing the repository and the growing demand for information from users internal and external to Fiocruz. In this work we propose the use of Data Science tools, especially Data Mining and Machine Learning techniques, with the objective of improving Information Retrieval by means of automatic classification of digital objects deposited in the Arca and the development and availability of the system of IR based on quality metrics related to precision and recall concepts.@en


El repositorio institucional Arca es el principal instrumento de realización del acceso abierto en la Fundación Oswaldo Cruz, teniendo como misión reunir, hospedar, preservar, poner a disposición y dar visibilidad a la producción intelectual de la Institución. La diversidad temática y la complejidad institucional de la Fundación fomentan un desafío metodológico relacionado con la clasificación y recuperación de los objetos digitales depositados y la gobernanza de los metadatos registrados por las comunidades que integran el repositorio. En 2016 el mecanismo de búsqueda del Arca contabilizó más de 400 mil consultas. Es necesario un sistema de Recuperación de la Información que atienda las especificidades de indexación del repositorio y la creciente demanda por información por parte de los usuarios internos y externos a Fiocruz. En este trabajo proponemos la utilización de herramientas de Ciencia de Datos, especialmente técnicas de Minería de Datos y Aprendizaje Automático con el objetivo de mejorar la Recuperación de la Información, a través de la clasificación automática de objetos digitales depositados en el Arca y el desarrollo y puesta a disposición del sistema de RI basado en métricas de calidad relacionadas con los conceptos de precisión y revocación.@es
O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundação fomentam um desafio metodológico relacionado a classificação e recuperação dos objetos digitais depositados e a governança dos metadados registrados pelas comunidades que integram o repositório. Em 2016 o mecanismo de busca do Arca contabilizou mais de 400 mil consultas. É necessário um sistema de Recuperação da Informação que atenda as especificidades de indexação do repositório e a crescente demanda por informação por parte dos usuários internos e externos a Fiocruz. Neste trabalho propomos a utilização de ferramentas de Ciência de Dados, especialmente técnicas de Mineração de Dados e Aprendizagem de Máquina com o objetivo de aprimorar a Recuperação da Informação, por meio da classificação automática de objetos digitais depositados no Arca e o desenvolvimento e disponibilização de sistema de RI baseado em métricas de qualidade relacionadas aos conceitos de precisão e revocação.@pt

. ::none::, [????].
NLP0.29
Visto 19 vezes
sem referências
Array
(
    [dateOfAvailability] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [2017-11-30] => 60993
                        )

                )

        )

    [hasAuthor] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Marcel de Moraes Pedroso] => 128200
                        )

                    [1] => Array
                        (
                            [Jefferson da Costa Lima] => 128201
                        )

                    [2] => Array
                        (
                            [Vinicius Belchior Assef Neto] => 128202
                        )

                )

        )

    [hasFileStorage] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [_repository/127865/2020/01/oai_ojs_reciis_icict_fiocruz_br_article_1417#00086.pdf] => 134450
                        )

                )

        )

    [hasSubject] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Data science] => 21310
                        )

                    [1] => Array
                        (
                            [Aprendizaje automático] => 121076
                        )

                    [2] => Array
                        (
                            [Ciência de dado] => 34139
                        )

                    [3] => Array
                        (
                            [Armazenamento e recuperação da informação] => 271971
                        )

                    [4] => Array
                        (
                            [Mineração de dado] => 15401
                        )

                    [5] => Array
                        (
                            [Aprendizagem de máquina] => 199132
                        )

                    [6] => Array
                        (
                            [Repositório institucional] => 177313
                        )

                    [7] => Array
                        (
                            [Ciência de dados] => 287892
                        )

                    [8] => Array
                        (
                            [Mineração de dados] => 270961
                        )

                    [9] => Array
                        (
                            [Repositórios institucionais] => 252250
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Information storage and retrieval] => 273448
                        )

                    [1] => Array
                        (
                            [Data mining] => 234340
                        )

                    [2] => Array
                        (
                            [Institutional repositories] => 173918
                        )

                    [3] => Array
                        (
                            [Data science] => 261522
                        )

                    [4] => Array
                        (
                            [Machine learning] => 247414
                        )

                    [5] => Array
                        (
                            [Institutional repositories] => 267732
                        )

                )

            [es] => Array
                (
                    [0] => Array
                        (
                            [Machine learning] => 85467
                        )

                    [1] => Array
                        (
                            [Ciencia de datos] => 274414
                        )

                    [2] => Array
                        (
                            [Almacenamiento y recuperación de la información] => 273449
                        )

                    [3] => Array
                        (
                            [Minería de datos] => 234336
                        )

                    [4] => Array
                        (
                            [Repositorios institucionales] => 11502
                        )

                    [5] => Array
                        (
                            [Aprendizaje automático] => 247418
                        )

                    [6] => Array
                        (
                            [Repositorios institucionales] => 272878
                        )

                )

        )

    [hasSectionOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Pecha Kucha] => 818
                        )

                )

        )

    [wasPublicationInDate] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [2017-11-30] => 235939
                        )

                )

        )

    [hasLanguageExpression] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [pt] => 232736
                        )

                )

        )

    [isPartOfSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Revista Eletrônica de Comunicação, Informação e Inovação em Saúde] => 127865
                        )

                )

        )

    [hasIssueOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:00086-2017-11-] => 127936
                        )

                )

        )

    [hasAbstract] => Array
        (
            [en] => Array
                (
                    [0] => Array
                        (
                            [The Arca institutional repository is the main instrument of open access at the Oswaldo Cruz Foundation, with the mission of gathering, hosting, preserving, making available and giving visibility to the institution’s intellectual production. The thematic diversity and institutional complexity of the Foundation foster a methodological challenge related to the classification and retrieval of deposited digital objects and the governance of the metadata recorded by the communities that make up the repository. In 2016, the Arca search engine counted more than 400 thousand queries. An Information Retrieval system is needed that meets the specificities of indexing the repository and the growing demand for information from users internal and external to Fiocruz. In this work we propose the use of Data Science tools, especially Data Mining and Machine Learning techniques, with the objective of improving Information Retrieval by means of automatic classification of digital objects deposited in the Arca and the development and availability of the system of IR based on quality metrics related to precision and recall concepts.] => 0
                        )

                    [1] => Array
                        (
                            [The Arca institutional repository is the main instrument of open access at the Oswaldo Cruz Foundation, with the mission of gathering, hosting, preserving, making available and giving visibility to the institution’s intellectual production. The thematic diversity and institutional complexity of the Foundation foster a methodological challenge related to the classification and retrieval of deposited digital objects and the governance of the metadata recorded by the communities that make up the repository. In 2016, the Arca search engine counted more than 400 thousand queries. An Information Retrieval system is needed that meets the specificities of indexing the repository and the growing demand for information from users internal and external to Fiocruz. In this work we propose the use of Data Science tools, especially Data Mining and Machine Learning techniques, with the objective of improving Information Retrieval by means of automatic classification of digital objects deposited in the Arca and the development and availability of the system of IR based on quality metrics related to precision and recall concepts.] => 0
                        )

                )

            [es] => Array
                (
                    [0] => Array
                        (
                            [El repositorio institucional Arca es el principal instrumento de realización del acceso abierto en la Fundación Oswaldo Cruz, teniendo como misión reunir, hospedar, preservar, poner a disposición y dar visibilidad a la producción intelectual de la Institución. La diversidad temática y la complejidad institucional de la Fundación fomentan un desafío metodológico relacionado con la clasificación y recuperación de los objetos digitales depositados y la gobernanza de los metadatos registrados por las comunidades que integran el repositorio. En 2016 el mecanismo de búsqueda del Arca contabilizó más de 400 mil consultas. Es necesario un sistema de Recuperación de la Información que atienda las especificidades de indexación del repositorio y la creciente demanda por información por parte de los usuarios internos y externos a Fiocruz. En este trabajo proponemos la utilización de herramientas de Ciencia de Datos, especialmente técnicas de Minería de Datos y Aprendizaje Automático con el objetivo de mejorar la Recuperación de la Información, a través de la clasificación automática de objetos digitales depositados en el Arca y el desarrollo y puesta a disposición del sistema de RI basado en métricas de calidad relacionadas con los conceptos de precisión y revocación.] => 0
                        )

                )

            [pt] => Array
                (
                    [0] => Array
                        (
                            [O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundação fomentam um desafio metodológico relacionado a classificação e recuperação dos objetos digitais depositados e a governança dos metadados registrados pelas comunidades que integram o repositório. Em 2016 o mecanismo de busca do Arca contabilizou mais de 400 mil consultas. É necessário um sistema de Recuperação da Informação que atenda as especificidades de indexação do repositório e a crescente demanda por informação por parte dos usuários internos e externos a Fiocruz. Neste trabalho propomos a utilização de ferramentas de Ciência de Dados, especialmente técnicas de Mineração de Dados e Aprendizagem de Máquina com o objetivo de aprimorar a Recuperação da Informação, por meio da classificação automática de objetos digitais depositados no Arca e o desenvolvimento e disponibilização de sistema de RI baseado em métricas de qualidade relacionadas aos conceitos de precisão e revocação.] => 0
                        )

                )

        )

    [hasID] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [oai:ojs.reciis.icict.fiocruz.br:article/1417] => 0
                        )

                    [1] => Array
                        (
                            [oai:www.reciis.icict.fiocruz.br:article/1417] => 0
                        )

                )

        )

    [hasRegisterId] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417] => 0
                        )

                    [1] => Array
                        (
                            [10.29397/reciis.v11i0.1417] => 0
                        )

                )

        )

    [hasSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Revista Eletrônica de Comunicação, Informação e Inovação em Saúde; v. 11 (2017): Suplemento] => 0
                        )

                    [1] => Array
                        (
                            [Revista Eletrônica de Comunicação, Informação & Inovação em Saúde; Vol. 11 (2017): Suplemento] => 0
                        )

                    [2] => Array
                        (
                            [Revista Eletrônica de Comunicação, Informação & Inovação em Saúde; v. 11 (2017): Suplemento] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [1981-6278] => 0
                        )

                )

            [es] => Array
                (
                    [0] => Array
                        (
                            [Revista Eletrônica de Comunicação, Informação e Inovação em Saúde; Vol. 11 (2017): Suplemento] => 0
                        )

                )

        )

    [hasTitle] => Array
        (
            [en] => Array
                (
                    [0] => Array
                        (
                            [Data Science applied to arca: development and availability of tools for information retrieval in the Institutional Repository of Fundação Oswaldo cruz] => 0
                        )

                )

            [es] => Array
                (
                    [0] => Array
                        (
                            [ciencia de Datos aplicada al arca: desarrollo y disponibilización de herramientas para recuperación de la información en el Repositorio Institucional de la Fundação Oswaldo cruz] => 0
                        )

                )

            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz] => 0
                        )

                )

        )

    [hasUrl] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417/pdf1417] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417] => 0
                        )

                    [1] => Array
                        (
                            [https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417/pdf1417] => 0
                        )

                )

        )

    [prefLabel] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Oai:ojs.reciis.icict.fiocruz.br:article/1417#00086] => 0
                        )

                )

        )

    [hasDOI] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [10.29397/reciis.v11i0.1417] => 0
                        )

                )

        )

)