Google ha lanzado
Dataset Search, una herramienta de búsqueda que permite acceder y consultar
datos integrados en cualquier tabla o base de datos, siempre que la publicación
del contenido se etiquete a través de estándares abiertos de indexación como
scheme.org para describir la información.
Dataset Search es
capaz de localizar las conjuntos de datos sin importar donde se encuentren
alojados, como se explica a través de una publicación en el blog oficial de
Google. A través de la herramienta se puede consultar información proveniente
de cualquier dirección, ya se trate de direcciones públicas, bibliotecas
digitales o webs personales de un autor.
El funcionamiento de
Dataset Search es similar al de Google Académico --enfocado a la búsqueda de
contenido y literatura de tipo científico-académica-- y cualquier persona puede
hacer uso de ellas, pues no se trata de una característica reservada para el
ámbito académico. Las fuentes consultadas van desde organismos gubernamentales
que hayan publicado en la Red hasta organizaciones especializadas de noticias
como ProPublica.
Las búsquedas de
'Dataset Search' se basan en el estándares abiertos para describir la
información publicada y así permitir que sea más fácilmente identificable, como
son schema.org u otros que mantengan el formato de vocabulario establecido por
el Consorcio 'World Wide Web' (W3C). Cualquiera que publique datos, puede
describirlos y etiquetarlos mediante esta forma para hacer su búsqueda algo más
sencillo.
Las búsquedas han de
ser claras y realizarse a través de formas que permitan que Google pueda
entender bien el contenido de las páginas. Se recomienda utilizar un 'sitemap'
o listado de URL del sitio que el usuario quiera indexar para que el buscador
pueda encontrar la dirección correspondiente.
La compañía también recoge en su blog de
desarrolladores consejos para realizar búsquedas más efectivas, lo cual
comprende el uso de etiquetas de búsqueda como 'sameAs', para conjuntos de
datos o descripciones de materiales republicados, o 'isBasedOn', en el caso de
que al republicarse los datos, estos se hayan cambiado de forma significativa. También
ayuda acotar las búsquedas al indicar cuándo se publicó, cómo se recopilaron
los datos o quién creó el contenido.
Dataset Search
funciona en varios idiomas y Google pretende llevar la herramienta a nuevos
idiomas próximamente. Esta iniciativa se recoge dentro de los esfuerzos de la
empresa por hacer de los datos recogidos dentro de documentos o bases de datos
en la Red algo más accesible.
Fuente: Europa Press