Article Brapci-Revistas

Aplicação do fator TF-IDF na análise semântica de uma coleção documental

Application of TF-IDF factor in the semantic analysis of a documentary collection

Aplicación del factor TF-IDF en el análisis semántico de una colección documental

Objective. This paper describes the application of a tool for the semantic analysis of a document collection based on the use of term frequency–inverse document frequency (TF – IDF). Methodology. A system based on PHP and MySQL database for the management of a thesaurus, the calculation of TF – IDF (as an indicator of semantic weight) and for development a relevance tree (consisting of those concepts is developed most relevant issue analyzed). The tool was tested to the semantic analysis of a documentary collection of Psychology. Results. The system was able to identify the level of track presence: professional ethics, in a collection of documents Psychology program. Conclusions. The experience described confirms the viability of the tool for the semantic analysis of a documentary collection. It underlines the relevance and capacities of information professionals to develop this kind of tools for processing information. The authors suggests a special technical approach for use of scripts and information flows.@en


Objetivo. Describe la aplicación de una herramienta para el análisis semántico de una colección documental, basada en el uso de la frecuencia de término – frecuencia inversa de documento (TF-IDF). Metodología. Se desarrolla un sistema, basado en lenguaje PHP y bases de datos MySQL, para la gestión de un tesauro, del cálculo TF-IDF (como indicador de peso semántico) y para el desarrollo de un árbol de relevancia (conformado por aquellos conceptos más relevantes del tema analizado). Se evaluó la herramienta en el análisis semántico de una colección documental de Psicología Resultados. El sistema logró identificar el nivel de presencia del tema: deontología profesional, en una colección los documentos del programa de Psicología. Conclusiones. La experiencia descrita confirma la viabilidad de la herramienta para el análisis semántico de una colección documental. Destaca la pertinencia y las capacidades de los profesionales de la información para el desarrollo de herramientas para el tratamiento de información. Los autores sugieren un especial abordaje técnico a partir del uso de scripts y de flujos de la información.@es
Objetivo. Descreve a aplicação de uma ferramenta para a análise semântica de uma coleção documentária, baseada em o uso da frequência de termo – frequência inversa de documento (TF-IDF). Metodologia. Desenvolve-se um sistema, baseado em linguagem PHP e base de dados MySQL, para o gerenciamento de um tesauro, do cálculo TF-IDF (como indicador da importância semântica) e para o desenvolvimento de uma árvore de relevância (conformado por aqueles conceitos mais relevantes do tema analisado). Avaliou-se a ferramenta na análise semântica de uma coleção documentária de Psicologia. Resultados. O sistema conseguiu identificar o nível de presença do tema: deontologia profissional, em uma coleção os documentos do programa de Psicologia. Conclusões. A experiência descrita confirma a viabilidade da ferramenta para a análise semântica de uma coleção documentária. Destaca a pertinência e as capacidades dos profissionais da informação para o desenvolvimento de ferramentas para o tratamento de informação. Os autores sugerem uma especial abordagem técnica a partir do uso de scripts e de fluxos da informação.@pt

. Application of tf-idf factor in the semantic analysis of a documentary collection aplicación del factor tf-idf en el análisis semántico de una colección documental aplicação do fator tf-idf na análise semântica de uma coleção documental. Biblios (peru), [????].
NLP0.29
Visto 20 vezes
sem referências
Array
(
    [dateOfAvailability] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [2015-11-24] => 60615
                        )

                )

        )

    [hasAuthor] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Andrés Vuotto] => 19689
                        )

                    [1] => Array
                        (
                            [Celeste Bogetti] => 81884
                        )

                    [2] => Array
                        (
                            [Gladys Fernández] => 53276
                        )

                )

        )

    [hasFileStorage] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [_repository/769/2018/09/oai_ojs_biblios_pitt_edu_article_227#00060.pdf] => 98639
                        )

                )

        )

    [hasPageEnd] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [13] => 1273
                        )

                )

        )

    [hasPageStart] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [1] => 696
                        )

                )

        )

    [hasSectionOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Original] => 444
                        )

                    [1] => Array
                        (
                            [Artigo] => 3
                        )

                )

        )

    [hasSubject] => Array
        (
            [en] => Array
                (
                    [0] => Array
                        (
                            [Semantic analysis] => 273422
                        )

                    [1] => Array
                        (
                            [Tf] => 81878
                        )

                    [2] => Array
                        (
                            [Idf] => 81879
                        )

                    [3] => Array
                        (
                            [Information retrieval] => 227532
                        )

                    [4] => Array
                        (
                            [Data mining] => 234340
                        )

                    [5] => Array
                        (
                            [Knowledge discovery] => 8444
                        )

                    [6] => Array
                        (
                            [Tf-idf] => 275787
                        )

                )

            [es] => Array
                (
                    [0] => Array
                        (
                            [Análisis semántico] => 273423
                        )

                    [1] => Array
                        (
                            [Tf-idf] => 81880
                        )

                    [2] => Array
                        (
                            [Recuperación de información] => 5951
                        )

                    [3] => Array
                        (
                            [Minería de datos] => 234336
                        )

                    [4] => Array
                        (
                            [Extracción de información en bases de datos] => 81881
                        )

                )

            [pt] => Array
                (
                    [0] => Array
                        (
                            [Análise semântica] => 273424
                        )

                    [1] => Array
                        (
                            [Recuperação de informação] => 282411
                        )

                    [2] => Array
                        (
                            [Mineração de dado] => 15401
                        )

                    [3] => Array
                        (
                            [Extração de informação em base de dado] => 81883
                        )

                    [4] => Array
                        (
                            [Tf-idf] => 275788
                        )

                    [5] => Array
                        (
                            [Mineração de dados] => 270961
                        )

                    [6] => Array
                        (
                            [Extração de informação em base de dados] => 275789
                        )

                )

        )

    [wasPublicationInDate] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [2015-11-24] => 274497
                        )

                )

        )

    [hasLanguageExpression] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [es] => 233522
                        )

                )

        )

    [hasLicense] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [RESERVERD] => 234643
                        )

                )

        )

    [isPartOfSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Biblios (Peru)] => 769
                        )

                )

        )

    [hasIssueOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:00060-2015--60] => 60602
                        )

                )

        )

    [hasAbstract] => Array
        (
            [en] => Array
                (
                    [0] => Array
                        (
                            [Objective. This paper describes the application of a tool for the semantic analysis of a document collection based on the use of term frequency–inverse document frequency (TF – IDF). Methodology. A system based on PHP and MySQL database for the management of a thesaurus, the calculation of TF – IDF (as an indicator of semantic weight) and for development a relevance tree (consisting of those concepts is developed most relevant issue analyzed). The tool was tested to the semantic analysis of a documentary collection of Psychology. Results. The system was able to identify the level of track presence: professional ethics, in a collection of documents Psychology program. Conclusions. The experience described confirms the viability of the tool for the semantic analysis of a documentary collection. It underlines the relevance and capacities of information professionals to develop this kind of tools for processing information. The authors suggests a special technical approach for use of scripts and information flows.] => 0
                        )

                    [1] => Array
                        (
                            [Objective. This paper describes the application of a tool for the semantic analysis of a document collection based on the use of term frequency–inverse document frequency (TF – IDF). Methodology. A system based on PHP and MySQL database for the management of a thesaurus, the calculation of TF – IDF (as an indicator of semantic weight) and for development a relevance tree (consisting of those concepts is developed most relevant issue analyzed). The tool was tested to the semantic analysis of a documentary collection of Psychology. Results. The system was able to identify the level of track presence: professional ethics, in a collection of documents Psychology program. Conclusions. The experience described confirms the viability of the tool for the semantic analysis of a documentary collection. It underlines the relevance and capacities of information professionals to develop this kind of tools for processing information. The authors suggests a special technical approach for use of scripts and information flows.] => 0
                        )

                )

            [es] => Array
                (
                    [0] => Array
                        (
                            [Objetivo. Describe la aplicación de una herramienta para el análisis semántico de una colección documental, basada en el uso de la frecuencia de término – frecuencia inversa de documento (TF-IDF). Metodología. Se desarrolla un sistema, basado en lenguaje PHP y bases de datos MySQL, para la gestión de un tesauro, del cálculo TF-IDF (como indicador de peso semántico) y para el desarrollo de un árbol de relevancia (conformado por aquellos conceptos más relevantes del tema analizado). Se evaluó la herramienta en el análisis semántico de una colección documental de Psicología Resultados. El sistema logró identificar el nivel de presencia del tema: deontología profesional, en una colección los documentos del programa de Psicología. Conclusiones. La experiencia descrita confirma la viabilidad de la herramienta para el análisis semántico de una colección documental. Destaca la pertinencia y las capacidades de los profesionales de la información para el desarrollo de herramientas para el tratamiento de información. Los autores sugieren un especial abordaje técnico a partir del uso de scripts y de flujos de la información.] => 0
                        )

                )

            [pt] => Array
                (
                    [0] => Array
                        (
                            [Objetivo. Descreve a aplicação de uma ferramenta para a análise semântica de uma coleção documentária, baseada em o uso da frequência de termo – frequência inversa de documento (TF-IDF). Metodologia. Desenvolve-se um sistema, baseado em linguagem PHP e base de dados MySQL, para o gerenciamento de um tesauro, do cálculo TF-IDF (como indicador da importância semântica) e para o desenvolvimento de uma árvore de relevância (conformado por aqueles conceitos mais relevantes do tema analisado). Avaliou-se a ferramenta na análise semântica de uma coleção documentária de Psicologia. Resultados. O sistema conseguiu identificar o nível de presença do tema: deontologia profissional, em uma coleção os documentos do programa de Psicologia. Conclusões. A experiência descrita confirma a viabilidade da ferramenta para a análise semântica de uma coleção documentária. Destaca a pertinência e as capacidades dos profissionais da informação para o desenvolvimento de ferramentas para o tratamento de informação. Os autores sugerem uma especial abordagem técnica a partir do uso de scripts e de fluxos da informação.] => 0
                        )

                )

        )

    [hasID] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [oai:ojs.biblios.pitt.edu:article/227] => 0
                        )

                )

        )

    [hasRegisterId] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://biblios.pitt.edu/ojs/index.php/biblios/article/view/227] => 0
                        )

                    [1] => Array
                        (
                            [10.5195/biblios.2015.227] => 0
                        )

                )

        )

    [hasSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Biblios: Journal of Librarianship and Information Science; Núm. 60 (2015); 1-13] => 0
                        )

                    [1] => Array
                        (
                            [1562-4730] => 0
                        )

                )

        )

    [hasTitle] => Array
        (
            [en] => Array
                (
                    [0] => Array
                        (
                            [Application of TF-IDF factor in the semantic analysis of a documentary collection] => 0
                        )

                )

            [es] => Array
                (
                    [0] => Array
                        (
                            [Aplicación del factor TF-IDF en el análisis semántico de una colección documental] => 0
                        )

                )

            [pt] => Array
                (
                    [0] => Array
                        (
                            [Aplicação do fator TF-IDF na análise semântica de uma coleção documental] => 0
                        )

                )

        )

    [hasUrl] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [https://biblios.pitt.edu/ojs/index.php/biblios/article/view/227/230] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [https://biblios.pitt.edu/ojs/biblios/article/view/227] => 0
                        )

                    [1] => Array
                        (
                            [https://biblios.pitt.edu/ojs/biblios/article/view/227/230] => 0
                        )

                )

        )

    [prefLabel] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Oai:ojs.biblios.pitt.edu:article/227#00060] => 0
                        )

                )

        )

    [hasDOI] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [10.5195/biblios.2015.227] => 0
                        )

                )

        )

)