Ciencia con espiral de limón

Science with a (lemon) twist
BLOG EN RECESO TEMPORAL

martes, 23 de febrero de 2010

Los retos de la publicación de datos primarios sobre biodiversidad

La información primaria son los datos crudos (sin procesar) que los investigadores generan como parte de su investigación. El acceso libre a los datos crudos generados por proyectos enfocados al estudio de la biodiversidad es importante puesto que su conocimiento y análisis ayudan en la toma de decisiones y sirve como sustento para las personas o grupos involucrados en la conservación de la biodiversidad. Sin embargo, la información primaria sobre biodiversidad es generalmente poco accesible y en muchos casos ni siquiera está digitalizada.


Los esfuerzos por incrementar el libre acceso a este tipo de información empezaron en 1991 con los Principios de Bromley. Otro tipo de esfuerzos el de la Declaración de Berlín en 2003 donde además se promovía el uso de internet como una herramienta importante para la difusión del conocimiento; la UNAM firmó esta declaración en el 2006. Muchas otras instituciones a nivel internacional han creado programas para promover el libre acceso a la información científica primaria, entre los que se encuentra la Infraestructura Mundial de Información en Biodiversidad GBIF (Global Biodiversity Information Facility) por sus siglas en inglés. Actualmente el GBIF está haciendo esfuerzos importantes al respecto.

A pesar de lo anterior, la mayoría de la información primaria sigue estando almacenada en estantes particulares y en medios electrónicos aislados. Por otro lado, es perfectamente entendible que los generadores de información teman que se haga mal uso de sus datos, no se den los créditos correspondientes por el uso de los mismos, no se establezcan acuerdos claros de cooperación y que todo esto repercuta en la competencia por posiciones académicas y financiamiento.

Vishwas Chavan y Peter Ingwersen autores de un artículo publicado en la revista BMC Bioinformatics sugieren que la falta de un Marco de Publicación de Datos que considere aspectos políticos, legales, socioculturales y económicos impide que los investigadores publiquen sus datos científicos primarios.

Tal vez uno de los temores principales para publicar datos sea que no existe un sistema que reconozca y premie a aquellos que publican datos primarios de biodiversidad. Para superar esto, se recomienda el uso identificadores persistentes (en las páginas electrónicas de los publicadores de datos, las hojas o grupos de datos, en los registros mismos, etc). En particular se propone el uso de un Índice de Uso de Datos o DUI por sus siglas en inglés (Data Usage Index) en cada punto de acceso a la información, así como un mecanismo de citación efectivo.

Ya existen varios tipos de identificadores globales persistentes, sin embargo, lo que más persiste es la falta de acuerdo respecto a cuál es el mejor e incluso sobre cuál debería ser la naturaleza de dichos identificadores. Estos identificadores se tienen que pensar en términos de la búsqueda y recuperación de información y en los beneficios que aporten tanto a los publicadores como a los generadores de información. Solo de esta manera el uso de un DUI estandarizado podrá volverse más estable y creíble e impactaría positivamente en el ciclo de manejo y publicación de información.

De forma paralela, es necesario crear un mecanismo de citación efectivo, puesto que sin él la implementación de un marco de publicación de datos permanecería incompleto. Es importante crear un sistema estandarizado para citar datos primarios; además de enriquecer los metadatos asociados con los grupos de datos ya sea para una parte o toda la información.

Es decir, si el uso de datos primarios pudiera ser rastreado y fuera posible hacer referencia a los datos primarios de los investigadores, así como medir el uso de los mismos de la misma manera en la que se hace referencia y se mide el impacto de sus publicaciones en revistas arbitradas, entonces se eliminaría una de sus preocupaciones principales y con esto se fomentaría la publicación de información y el acceso libre a la misma.
Figura 1. Elementos del Marco de Publicación de datos (A) y componentes centrales técnicos y de infraestructura del mismo (B) (tomado de Chavan VS y Ingwersen P, 2009).

Aunado a lo anterior es necesario fomentar un cambio de actitud en los publicadores de información científica, sociedades científicas, investigadores y agencias de financiamiento y gubernamentales para lograr que el acceso libre a la información primaria se convierta en una realidad en el corto plazo.

Artículo de referencia:
ResearchBlogging.org
Chavan, V., & Ingwersen, P. (2009). Towards a data publishing framework for primary biodiversity data: challenges and potentials for the biodiversity informatics community BMC Bioinformatics, 10 (Suppl 14) DOI: 10.1186/1471-2105-10-S14-S2

1 comentario:

  1. Waaooo, pues si que es un reto interesante el que tienen instituciones como CONABIO o UNIBIO o esas que tienen bases de datos e información especializada, y que no están tan disponibles para los legos y los no tan legos.
    Esos egoismos de "mi información es mi información" no se confieren a solo un país o idiosincracia sino a todo esa secrecia que queremos que se le de a nuestra información. Ojalá pronto haya politicas institucionales al respecto y también politicas para citar y dar credito a los productores de esa info. Garcias por el Blots

    ResponderEliminar