Article Brapci-Revistas

Estudo de um critério para indexação automática derivativa de textos científicos e tecnológicos

Este trabalho é uma contribuição ao estudo da indexação automática fundamentado na íreqüência de ocorrência de palavras. investiga a aplicação da 1a e 2ª leis de zipf e ponto t de goffman, em 11 notas técnicas de mecânica dos solos, engenharia civil. entretanto, sugeriram a formulação de uma lei, aqui, denominada lei da amplitude de variação de r.f. além disso, através de um estudo estatístico da freqüência de ocorrência de palavras, mostra-se que é possível estimar a freqüência da palavra de maior ocorrência, e a distribuição de r.f. de um texto. sugere-se, também, um critério matemático para delimitar a região de transição de goffman, onde há concentração de palavras de alto conteúdo semântico. finalmente, propõem-se futuras investigações para ratificar a lei de formação, citada anteriormente, e o critério de delimitação da região de transição, com o objetivo de contribuir para um mecanismo básico de indexação de textos científicos e tecnológicos.palavras-chaveindexação automática. recuperação da informação. freqüência de palavras. região de transição de goffman. study of a criteria for automatic indexing of scientific and technological textsabstractthis work is a contribution to the study of automatic indexing, based on word frequency of occurrences in texts. it investigates the application of zipf´s first and second laws and goffman´s transition point, in eleven technical notes of soil mechanics, civil engineering. the results showed a nonconformity with the zipfs laws. however, it suggests the formulation of a new law here named the amplitude of variation of r.f. beyond this, it is showed that the word of maximum occurrence and the distribution of r.f. can bem achieved through an statistical study of word frequency of occurrences. it also suggests a mathematical approach to define the transition region, proposed by goffman, where the concentration of words of high semantic content probably occurs, i.e., those words most suitable as indexing terms. finally, future research is suggested to ratify the obtained results and to improve the process in order to use it as a tool for automatic indexing of scientific and technological texts. keywordsautomatic indexing. information retrievar. word frequency. goffman´s transition point region. scientific and technological texts.@pt


. Estudo de um critério para indexação automática derivativa de textos científicos e tecnológicos. Ciência da informação, [????].
NLP0.29
Visto 18 vezes
sem referências
Array
(
    [dateOfAvailability] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [1994-12-30] => 17537
                        )

                )

        )

    [hasAuthor] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Vânia Lisbôa da Silveira Guedes] => 20622
                        )

                )

        )

    [hasFileStorage] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [_repository/146/2018/09/oai_ojs_revista_ibict_br_article_529#00010.pdf] => 54981
                        )

                )

        )

    [hasSectionOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Artigo] => 3
                        )

                )

        )

    [hasSubject] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciência da informação] => 237157
                        )

                    [1] => Array
                        (
                            [Indexação automática] => 200690
                        )

                    [2] => Array
                        (
                            [Recuperação da informação] => 261956
                        )

                    [3] => Array
                        (
                            [Freqüência de palavra] => 20620
                        )

                    [4] => Array
                        (
                            [Região de transição de goffman] => 270724
                        )

                    [5] => Array
                        (
                            [Freqüência de palavras] => 199305
                        )

                )

        )

    [wasPublicationInDate] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [1994-12-30] => 270720
                        )

                )

        )

    [hasLanguageExpression] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [pt] => 232736
                        )

                )

        )

    [hasLicense] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [RESERVERD] => 234643
                        )

                )

        )

    [isPartOfSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciência da informação] => 146
                        )

                )

        )

    [hasIssueOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:00010-1994-23-3] => 17535
                        )

                )

        )

    [hasAbstract] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Este trabalho é uma contribuição ao estudo da indexação automática fundamentado na íreqüência de ocorrência de palavras. investiga a aplicação da 1a e 2ª leis de zipf e ponto t de goffman, em 11 notas técnicas de mecânica dos solos, engenharia civil. entretanto, sugeriram a formulação de uma lei, aqui, denominada lei da amplitude de variação de r.f. além disso, através de um estudo estatístico da freqüência de ocorrência de palavras, mostra-se que é possível estimar a freqüência da palavra de maior ocorrência, e a distribuição de r.f. de um texto. sugere-se, também, um critério matemático para delimitar a região de transição de goffman, onde há concentração de palavras de alto conteúdo semântico. finalmente, propõem-se futuras investigações para ratificar a lei de formação, citada anteriormente, e o critério de delimitação da região de transição, com o objetivo de contribuir para um mecanismo básico de indexação de textos científicos e tecnológicos.palavras-chaveindexação automática. recuperação da informação. freqüência de palavras. região de transição de goffman. study of a criteria for automatic indexing of scientific and technological textsabstractthis work is a contribution to the study of automatic indexing, based on word frequency of occurrences in texts. it investigates the application of zipf´s first and second laws and goffman´s transition point, in eleven technical notes of soil mechanics, civil engineering. the results showed a nonconformity with the zipfs laws. however, it suggests the formulation of a new law here named the amplitude of variation of r.f. beyond this, it is showed that the word of maximum occurrence and the distribution of r.f. can bem achieved through an statistical study of word frequency of occurrences. it also suggests a mathematical approach to define the transition region, proposed by goffman, where the concentration of words of high semantic content probably occurs, i.e., those words most suitable as indexing terms. finally, future research is suggested to ratify the obtained results and to improve the process in order to use it as a tool for automatic indexing of scientific and technological texts. keywordsautomatic indexing. information retrievar. word frequency. goffman´s transition point region. scientific and technological texts.] => 0
                        )

                )

        )

    [hasID] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [oai:ojs.revista.ibict.br:article/529] => 0
                        )

                )

        )

    [hasRegisterId] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [http://revista.ibict.br/ciinf/article/view/529] => 0
                        )

                    [1] => Array
                        (
                            [10.18225/ci.inf..v23i3.529] => 0
                        )

                )

        )

    [hasSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciência da Informação; v. 23, n. 3 (1994)] => 0
                        )

                    [1] => Array
                        (
                            [0100-1965] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [1518-8353] => 0
                        )

                )

        )

    [hasTitle] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Estudo de um critério para indexação automática derivativa de textos científicos e tecnológicos] => 0
                        )

                )

        )

    [hasUrl] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [http://revista.ibict.br/ciinf/article/view/529/529] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [https://revista.ibict.br/ciinf/article/view/529] => 0
                        )

                    [1] => Array
                        (
                            [https://revista.ibict.br/ciinf/article/view/529/529] => 0
                        )

                )

        )

    [prefLabel] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Oai:ojs.revista.ibict.br:article/529#00010] => 0
                        )

                )

        )

    [hasDOI] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [10.18225/ci.inf.v23i3.529] => 0
                        )

                    [1] => Array
                        (
                            [10.18225/ci.inf.v23i3.529.g529] => 0
                        )

                )

        )

)