Article
A quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano.@pt
Array ( [dateOfAvailability] => Array ( [pt] => Array ( [0] => Array ( [2019-04-15] => 112211 ) ) ) [hasAuthor] => Array ( [nn] => Array ( [0] => Array ( [Lucas Marques Sathler Guimarães] => 112212 ) [1] => Array ( [Magali Rezende Gouvêa Meireles] => 7470 ) [2] => Array ( [Paulo Eduardo Maciel Almeida] => 27288 ) ) ) [hasFileStorage] => Array ( [nn] => Array ( [0] => Array ( [_repository/477/2019/04/oai_ojs_testes_eci_ufmg_br_article_3505#00029.pdf] => 112291 ) ) ) [hasPageEnd] => Array ( [pt] => Array ( [0] => Array ( [190] => 1540 ) ) ) [hasPageStart] => Array ( [pt] => Array ( [0] => Array ( [169] => 2911 ) ) ) [hasSectionOf] => Array ( [pt] => Array ( [0] => Array ( [Artigo] => 3 ) ) ) [hasSubject] => Array ( [pt] => Array ( [0] => Array ( [Ciência da informação] => 237157 ) [1] => Array ( [Ciência da computação] => 269911 ) [2] => Array ( [Classificação] => 200282 ) [3] => Array ( [Processamento de linguagem natural] => 235991 ) [4] => Array ( [Recuperação da informação] => 261956 ) [5] => Array ( [Rede neural artificial] => 7469 ) [6] => Array ( [Treinamento] => 269609 ) [7] => Array ( [Redes neurais artificiais] => 263396 ) [8] => Array ( [Treinamento] => 14784 ) ) ) [wasPublicationInDate] => Array ( [nn] => Array ( [0] => Array ( [2019-04-15] => 279883 ) ) ) [hasLanguageExpression] => Array ( [nn] => Array ( [0] => Array ( [pt] => 232736 ) ) ) [hasLicense] => Array ( [nn] => Array ( [0] => Array ( [RESERVERD] => 234643 ) ) ) [isPartOfSource] => Array ( [pt] => Array ( [0] => Array ( [Perspectivas em ciência da informação] => 477 ) ) ) [hasIssueOf] => Array ( [pt] => Array ( [0] => Array ( [ISSUE:JNL:00029-2019-24-1] => 112209 ) ) ) [hasAbstract] => Array ( [pt] => Array ( [0] => Array ( [A quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano.] => 0 ) ) ) [hasID] => Array ( [nn] => Array ( [0] => Array ( [oai:ojs.testes.eci.ufmg.br:article/3505] => 0 ) [1] => Array ( [oai:periodicos.ufmg.br:article/22609] => 0 ) ) ) [hasRegisterId] => Array ( [pt] => Array ( [0] => Array ( [http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/3505] => 0 ) [1] => Array ( [https://periodicos.ufmg.br/index.php/pci/article/view/22609] => 0 ) ) ) [hasSource] => Array ( [pt] => Array ( [0] => Array ( [Perspectivas em Ciência da Informação; v. 24, n. 1 (2019); 169-190] => 0 ) [1] => Array ( [Perspectivas em Ciência da Informação; v. 24 n. 1 (2019); 169-190] => 0 ) [2] => Array ( [1413-9936] => 0 ) ) [nn] => Array ( [0] => Array ( [19815344] => 0 ) [1] => Array ( [1981-5344] => 0 ) ) ) [hasTitle] => Array ( [pt] => Array ( [0] => Array ( [Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação] => 0 ) ) ) [hasUrl] => Array ( [pt] => Array ( [0] => Array ( [http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/3505/2262] => 0 ) [1] => Array ( [https://periodicos.ufmg.br/index.php/pci/article/view/22609/18193] => 0 ) ) [nn] => Array ( [0] => Array ( [https://periodicos.ufmg.br/index.php/pci/article/view/22609] => 0 ) [1] => Array ( [https://periodicos.ufmg.br/index.php/pci/article/view/22609/18193] => 0 ) ) ) [prefLabel] => Array ( [pt] => Array ( [0] => Array ( [Oai:ojs.testes.eci.ufmg.br:article/3505#00029] => 0 ) ) ) )