20 maio 2019

Google Dataset Search – Facilitando a descoberta de conjuntos de dados


No mundo de hoje, cientistas em muitas disciplinas e um número crescente de jornalistas vivem e respiram dados. Existem muitos milhares de repositórios de dados na web, fornecendo acesso a milhões de conjuntos de dados; e os governos locais e nacionais em todo o mundo também publicam seus dados. Para facilitar o acesso a esses dados, foi lançada a Pesquisa de Conjunto de Dados, para que cientistas, jornalistas de dados, “geeks” de dados ou qualquer outra pessoa possam encontrar os dados necessários para seu trabalho e suas histórias, ou simplesmente para satisfazer sua curiosidade intelectual.
Semelhante ao funcionamento do Google Scholar, a Pesquisa de conjunto de dados permite que você encontre conjuntos de dados onde quer que eles estejam hospedados, seja no site de um editor, em uma biblioteca digital ou uma página web pessoal do autor. Para criar uma pesquisa de conjunto de dados, desenvolvemos diretrizes para provedores de conjunto de dados para descrever seus dados de uma forma que o Google (e outros mecanismos de busca) possam entender melhor o conteúdo de suas páginas. 
Essas diretrizes incluem informações importantes sobre conjuntos de dados: quem criou o conjunto de dados, quando foi publicado, como os dados foram coletados, quais são os termos utilizados para definir os dados etc. Coletamos e vinculamos essas informações, analisamos onde podem estar as diferentes versões de um mesmo conjunto de dados e encontramos publicações que podem estar descrevendo ou discutindo o conjunto de dados. Nossa abordagem é baseada em um padrão aberto para descrever essas informações (schema.org) e qualquer pessoa que publique dados pode descrever seu conjunto de dados dessa maneira. Incentivamos os provedores de conjunto de dados, grandes e pequenos, a adotarem esse padrão comum, de modo que todos os conjuntos de dados façam parte desse ecossistema robusto.  Leia mais.   Fonte: SIBiUSP - 17/5/2019