This work presents a study for integration between the Brazilian Digital Library of Theses and Dissertations (BDTD), CAPESâs database of Theses and Dissertations and the national database of curriculum of researchers (Lattes platform). In all, more than 2 million records were analyzed and some computational procedures were adopted to collect, normalize and transform the data, as well as the application of string similarity algorithms to identify common registers between the databases. As a result, it has been observed that more than 240,000 records are at the intersection of BDTD and BTD CAPES, and that the Lattes Platform contains almost all of the records of these two databases.@en
Este trabajo muestra un estudio para la integración entre la Biblioteca Digital Brasileña de Tesis y Disertaciones (BDTD), el Banco Tesis y Disertaciones de la CAPES y la base nacional de currículos de investigadores (Plataforma Lattes). En total se analizaron más de 2 millones de registros y se adoptaron algunos procedimientos computacionales para recopilar, normalizar y transformar los datos, además de la aplicación de algoritmos de similitud de cadenas para identificación de registros comunes entre las bases. Como resultado, se observó que más de 240 mil registros están en la intersección de BDTD y BTD CAPES, y que la Plataforma Lattes contiene casi la totalidad de los registros de estas dos bases.@es
Este trabalho exibe uma estudo para integração entre a Biblioteca Digital Brasileira de Teses e Dissertações (BDTD), o Banco Teses e Dissertações da CAPES e a base nacional de currículos de pesquisadores (Plataforma Lattes). Ao todo foram analisados mais de 2 milhões de registros e foram adotados alguns procedimentos computacionais para coletar, normalizar e transformar os dados, além da aplicação de algoritmos de similaridade de strings para identificação de registros comuns entre as bases. Como resultado, observou-se que mais de 240 mil registros são estão na intersecção de BDTD e BTD CAPES, e que a Plataforma Lattes contém quase que a totalidade dos registros destas duas bases.@pt