Article Brapci-Revistas

Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação

A quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano.@pt


. Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação. Perspectivas em ciência da informação, [????].
NLP0.29
Visto 13 vezes
sem referências
Array
(
    [dateOfAvailability] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [2019-04-15] => 112211
                        )

                )

        )

    [hasAuthor] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Lucas Marques Sathler Guimarães] => 112212
                        )

                    [1] => Array
                        (
                            [Magali Rezende Gouvêa Meireles] => 7470
                        )

                    [2] => Array
                        (
                            [Paulo Eduardo Maciel Almeida] => 27288
                        )

                )

        )

    [hasFileStorage] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [_repository/477/2019/04/oai_ojs_testes_eci_ufmg_br_article_3505#00029.pdf] => 112291
                        )

                )

        )

    [hasPageEnd] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [190] => 1540
                        )

                )

        )

    [hasPageStart] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [169] => 2911
                        )

                )

        )

    [hasSectionOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Artigo] => 3
                        )

                )

        )

    [hasSubject] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciência da informação] => 237157
                        )

                    [1] => Array
                        (
                            [Ciência da computação] => 269911
                        )

                    [2] => Array
                        (
                            [Classificação] => 200282
                        )

                    [3] => Array
                        (
                            [Processamento de linguagem natural] => 235991
                        )

                    [4] => Array
                        (
                            [Recuperação da informação] => 261956
                        )

                    [5] => Array
                        (
                            [Rede neural artificial] => 7469
                        )

                    [6] => Array
                        (
                            [Treinamento] => 269609
                        )

                    [7] => Array
                        (
                            [Redes neurais artificiais] => 263396
                        )

                    [8] => Array
                        (
                            [Treinamento] => 14784
                        )

                )

        )

    [wasPublicationInDate] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [2019-04-15] => 279883
                        )

                )

        )

    [hasLanguageExpression] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [pt] => 232736
                        )

                )

        )

    [hasLicense] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [RESERVERD] => 234643
                        )

                )

        )

    [isPartOfSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Perspectivas em ciência da informação] => 477
                        )

                )

        )

    [hasIssueOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:00029-2019-24-1] => 112209
                        )

                )

        )

    [hasAbstract] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [A quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano.] => 0
                        )

                )

        )

    [hasID] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [oai:ojs.testes.eci.ufmg.br:article/3505] => 0
                        )

                    [1] => Array
                        (
                            [oai:periodicos.ufmg.br:article/22609] => 0
                        )

                )

        )

    [hasRegisterId] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/3505] => 0
                        )

                    [1] => Array
                        (
                            [https://periodicos.ufmg.br/index.php/pci/article/view/22609] => 0
                        )

                )

        )

    [hasSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Perspectivas em Ciência da Informação; v. 24, n. 1 (2019); 169-190] => 0
                        )

                    [1] => Array
                        (
                            [Perspectivas em Ciência da Informação; v. 24 n. 1 (2019); 169-190] => 0
                        )

                    [2] => Array
                        (
                            [1413-9936] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [19815344] => 0
                        )

                    [1] => Array
                        (
                            [1981-5344] => 0
                        )

                )

        )

    [hasTitle] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação] => 0
                        )

                )

        )

    [hasUrl] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/3505/2262] => 0
                        )

                    [1] => Array
                        (
                            [https://periodicos.ufmg.br/index.php/pci/article/view/22609/18193] => 0
                        )

                )

            [nn] => Array
                (
                    [0] => Array
                        (
                            [https://periodicos.ufmg.br/index.php/pci/article/view/22609] => 0
                        )

                    [1] => Array
                        (
                            [https://periodicos.ufmg.br/index.php/pci/article/view/22609/18193] => 0
                        )

                )

        )

    [prefLabel] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Oai:ojs.testes.eci.ufmg.br:article/3505#00029] => 0
                        )

                )

        )

)