Article
Os currículos cadastrados na Plataforma Lattes do CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico), são importantes fontes de dados abertos que possibilitam obter informações sobre formação acadêmica, produção científica, projetos de pesquisa e atuação profissional de um conjunto de indivíduos. O que possibilita a realização de diversos tipos de análises bibliométricas, podendo ser aplicados tanto métodos ou modelos tradicionais, quanto alternativos para a avaliação da ciência. O estudo apresentado, trata de afirmar sobre a viabilidade de aplicação de PLN (Processamento de Linguagem Natural) para a avaliação de similaridade semântica sobre os dados cadastrados no currículo Lattes. Para a realização de análises utilizou-se uma amostra de curículos referentes a doutores e realizado o tratamento em um corpus textual, para a representação semântica vetorial, foi aplicada a ferramenta Word2Vec, sendo possível a realização de inferência dos termos. Como resultados foram apresentados índices de similaridade calculados pelo modelo em palavras contidas em títulos de publicações@pt
Array ( [hasAuthor] => Array ( [nn] => Array ( [0] => Array ( [Thiago Magela Rodrigues Dias] => 9200 ) [1] => Array ( [Felipe de Paula Oliveira] => 136522 ) [2] => Array ( [Adilson Luiz Pinto] => 638 ) ) ) [dateOfAvailability] => Array ( [pt] => Array ( [0] => Array ( [2020-03-20] => 136271 ) ) ) [hasFileStorage] => Array ( [nn] => Array ( [0] => Array ( [_repository/146/2020/04/oai_ojs_revista_ibict_br_article_4922#00010.pdf] => 138962 ) ) ) [hasSubject] => Array ( [pt] => Array ( [0] => Array ( [Ciência da informação] => 237157 ) [1] => Array ( [Plataforma lattes] => 227477 ) [2] => Array ( [Processamento de linguagem natural] => 235991 ) [3] => Array ( [Similaridade semântica] => 270958 ) ) ) [hasSectionOf] => Array ( [pt] => Array ( [0] => Array ( [Poster] => 200 ) ) ) [wasPublicationInDate] => Array ( [nn] => Array ( [0] => Array ( [2020-03-20] => 270931 ) ) ) [hasLanguageExpression] => Array ( [nn] => Array ( [0] => Array ( [pt] => 232736 ) ) ) [hasLicense] => Array ( [nn] => Array ( [0] => Array ( [RESERVERD] => 234643 ) ) ) [isPartOfSource] => Array ( [pt] => Array ( [0] => Array ( [Ciência da informação] => 146 ) ) ) [hasIssueOf] => Array ( [pt] => Array ( [0] => Array ( [ISSUE:JNL:00010-2019-48-3] => 120104 ) ) ) [hasAbstract] => Array ( [pt] => Array ( [0] => Array ( [Os currículos cadastrados na Plataforma Lattes do CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico), são importantes fontes de dados abertos que possibilitam obter informações sobre formação acadêmica, produção científica, projetos de pesquisa e atuação profissional de um conjunto de indivíduos. O que possibilita a realização de diversos tipos de análises bibliométricas, podendo ser aplicados tanto métodos ou modelos tradicionais, quanto alternativos para a avaliação da ciência. O estudo apresentado, trata de afirmar sobre a viabilidade de aplicação de PLN (Processamento de Linguagem Natural) para a avaliação de similaridade semântica sobre os dados cadastrados no currículo Lattes. Para a realização de análises utilizou-se uma amostra de curículos referentes a doutores e realizado o tratamento em um corpus textual, para a representação semântica vetorial, foi aplicada a ferramenta Word2Vec, sendo possível a realização de inferência dos termos. Como resultados foram apresentados índices de similaridade calculados pelo modelo em palavras contidas em títulos de publicações] => 0 ) ) ) [hasID] => Array ( [nn] => Array ( [0] => Array ( [oai:ojs.revista.ibict.br:article/4922] => 0 ) ) ) [hasRegisterId] => Array ( [pt] => Array ( [0] => Array ( [http://revista.ibict.br/ciinf/article/view/4922] => 0 ) ) ) [hasSource] => Array ( [pt] => Array ( [0] => Array ( [Ciência da Informação; v. 48, n. 3 (2019): Suplemento: Trabalhos apresentados na 10ª Conferência Luso-Brasileira de Ciência Aberta - ConfOA] => 0 ) [1] => Array ( [0100-1965] => 0 ) ) [nn] => Array ( [0] => Array ( [1518-8353] => 0 ) ) ) [hasTitle] => Array ( [pt] => Array ( [0] => Array ( [Modelagem Semântica de Dados Abertos: A Viabilidade de Aplicação de Word Embeddings sobre o Currículo Lattes] => 0 ) ) ) [hasUrl] => Array ( [pt] => Array ( [0] => Array ( [http://revista.ibict.br/ciinf/article/view/4922/4511] => 0 ) ) [nn] => Array ( [0] => Array ( [https://revista.ibict.br/ciinf/article/view/4922] => 0 ) [1] => Array ( [https://revista.ibict.br/ciinf/article/view/4922/4511] => 0 ) ) ) [prefLabel] => Array ( [pt] => Array ( [0] => Array ( [Oai:ojs.revista.ibict.br:article/4922#00010] => 0 ) ) ) [hasDOI] => Array ( [nn] => Array ( [0] => Array ( [10.18225/ci.inf.v48i3.4922] => 0 ) [1] => Array ( [10.18225/ci.inf.v48i3.4922.g4511] => 0 ) ) ) )