Array
(
    [responseDate] => 2023-12-26T03:13:49Z
    [request] => https://periodicos.ufmg.br/index.php/moci/oai
    [GetRecord] => SimpleXMLElement Object
        (
            [record] => SimpleXMLElement Object
                (
                    [header] => SimpleXMLElement Object
                        (
                            [identifier] => oai:periodicos.ufmg.br:article/19170
                            [datestamp] => 2020-04-19T19:55:40Z
                            [setSpec] => moci:ART
                        )

                    [metadata] => SimpleXMLElement Object
                        (
                            [dc] => SimpleXMLElement Object
                                (
                                    [title] => Array
                                        (
                                            [0] => Automatic grouping of news from online newspapers using Machine Learning techniques for clustering texts in Portuguese
                                            [1] => Agrupamento automático de notícias de jornais on-line usando técnicas de Machine Learning para clustering de textos no idioma português
                                        )

                                    [creator] => Array
                                        (
                                            [0] => Magalhães , Lúcia Helena de 
                                            [1] => Souza , Renato Rocha 
                                        )

                                    [subject] => Array
                                        (
                                            [0] => Agrupamento de notícias
                                            [1] => Processamento de linguagem natural
                                            [2] => Aprendizado de Máquina
                                            [3] => Análise de textos
                                            [4] => Grouping of news
                                            [5] => Natural Language Processing
                                            [6] => Machine Learning
                                            [7] => Text analysis
                                        )

                                    [description] => Array
                                        (
                                            [0] => Clustering is a technique of organizing data into groups whose members have some similarity. Thus, this research aimed to use the techniques of Natural Language Processing, Machine Learning and Clustering to create clusters of news from a sample collected from the main online newspapers. It was found that the pre-processing step requires an effort to guarantee the quality of the results. The complexity of the Portuguese language, the need to update the list of stopwords, the difficulties related to the detection of the most important characteristics and the high dimensionality of the data were evidenced during all stages of this study. The k-means clustering algorithm obtained the best results for this type of information and Hierarchical Clustering had difficulties, since similar news were allocated to different groups. Affinity Propagation, on the other hand, disagreed as to the ideal number of clusters, but achieved a good performance when grouping by similarity.
                                            [1] => Clusterização é uma técnica de organizar dados em grupos cujos membros apresentam alguma similaridade. Assim, esta pesquisa teve como objetivo utilizar as técnicas de Processamento de Lin-guagem Natural, Machine Learning e Clustering para criar aglomerados de notícias a partir de uma amostra coletada dos principais jornais on-line. Verificou-se que a etapa de pré-processamento exige um esforço para garantir a qualidade dos resultados. A complexidade da língua portuguesa, a necessidade de atualização da lista de stopwords, as dificuldades relacionadas à detecção das características mais importantes e à alta dimensionalidade dos dados foram evidenciadas durante todas as etapas deste estudo. O algoritmo de agrupamento k-means obtive os melhores resultados para esse tipo de informação e o Hierarchical Clustering teve dificuldades, visto que notícias semelhantes foram alocadas em grupos diferentes. Já o Affinity Propagation apresentou divergência quanto ao número ideal de clusters, mas conseguiu um bom desempenho ao agrupar por semelhança.
                                        )

                                    [publisher] => Universidade Federal de Minas Gerais (UFMG)
                                    [date] => 2020-02-03
                                    [type] => Array
                                        (
                                            [0] => info:eu-repo/semantics/article
                                            [1] => info:eu-repo/semantics/publishedVersion
                                        )

                                    [format] => application/pdf
                                    [identifier] => https://periodicos.ufmg.br/index.php/moci/article/view/19170
                                    [source] => Array
                                        (
                                            [0] => Múltiplos Olhares em Ciência da Informação ; Vol. 9 No. 2 (2019): PPGGOG - Discentes
                                            [1] => Múltiplos Olhares em Ciência da Informação - ISSN 2237-6658; Vol. 9 Núm. 2 (2019): PPGGOG - Discentes
                                            [2] => Múltiplos Olhares em Ciência da Informação - ISSN 2237-6658; Vol. 9 No 2 (2019): PPGGOG - Discentes
                                            [3] => Múltiplos Olhares em Ciência da Informação; v. 9 n. 2 (2019): PPGGOG - Discentes
                                            [4] => 2237-6658
                                        )

                                    [language] => por
                                    [relation] => https://periodicos.ufmg.br/index.php/moci/article/view/19170/16237
                                    [rights] => Copyright (c) 2020 Múltiplos Olhares em Ciência da Informação
                                )

                        )

                )

        )

)