Ciencia con espiral de limón

Science with a (lemon) twist
BLOG EN RECESO TEMPORAL

martes, 23 de febrero de 2010

Los retos de la publicación de datos primarios sobre biodiversidad

La información primaria son los datos crudos (sin procesar) que los investigadores generan como parte de su investigación. El acceso libre a los datos crudos generados por proyectos enfocados al estudio de la biodiversidad es importante puesto que su conocimiento y análisis ayudan en la toma de decisiones y sirve como sustento para las personas o grupos involucrados en la conservación de la biodiversidad. Sin embargo, la información primaria sobre biodiversidad es generalmente poco accesible y en muchos casos ni siquiera está digitalizada.


Los esfuerzos por incrementar el libre acceso a este tipo de información empezaron en 1991 con los Principios de Bromley. Otro tipo de esfuerzos el de la Declaración de Berlín en 2003 donde además se promovía el uso de internet como una herramienta importante para la difusión del conocimiento; la UNAM firmó esta declaración en el 2006. Muchas otras instituciones a nivel internacional han creado programas para promover el libre acceso a la información científica primaria, entre los que se encuentra la Infraestructura Mundial de Información en Biodiversidad GBIF (Global Biodiversity Information Facility) por sus siglas en inglés. Actualmente el GBIF está haciendo esfuerzos importantes al respecto.

A pesar de lo anterior, la mayoría de la información primaria sigue estando almacenada en estantes particulares y en medios electrónicos aislados. Por otro lado, es perfectamente entendible que los generadores de información teman que se haga mal uso de sus datos, no se den los créditos correspondientes por el uso de los mismos, no se establezcan acuerdos claros de cooperación y que todo esto repercuta en la competencia por posiciones académicas y financiamiento.

Vishwas Chavan y Peter Ingwersen autores de un artículo publicado en la revista BMC Bioinformatics sugieren que la falta de un Marco de Publicación de Datos que considere aspectos políticos, legales, socioculturales y económicos impide que los investigadores publiquen sus datos científicos primarios.

Tal vez uno de los temores principales para publicar datos sea que no existe un sistema que reconozca y premie a aquellos que publican datos primarios de biodiversidad. Para superar esto, se recomienda el uso identificadores persistentes (en las páginas electrónicas de los publicadores de datos, las hojas o grupos de datos, en los registros mismos, etc). En particular se propone el uso de un Índice de Uso de Datos o DUI por sus siglas en inglés (Data Usage Index) en cada punto de acceso a la información, así como un mecanismo de citación efectivo.

Ya existen varios tipos de identificadores globales persistentes, sin embargo, lo que más persiste es la falta de acuerdo respecto a cuál es el mejor e incluso sobre cuál debería ser la naturaleza de dichos identificadores. Estos identificadores se tienen que pensar en términos de la búsqueda y recuperación de información y en los beneficios que aporten tanto a los publicadores como a los generadores de información. Solo de esta manera el uso de un DUI estandarizado podrá volverse más estable y creíble e impactaría positivamente en el ciclo de manejo y publicación de información.

De forma paralela, es necesario crear un mecanismo de citación efectivo, puesto que sin él la implementación de un marco de publicación de datos permanecería incompleto. Es importante crear un sistema estandarizado para citar datos primarios; además de enriquecer los metadatos asociados con los grupos de datos ya sea para una parte o toda la información.

Es decir, si el uso de datos primarios pudiera ser rastreado y fuera posible hacer referencia a los datos primarios de los investigadores, así como medir el uso de los mismos de la misma manera en la que se hace referencia y se mide el impacto de sus publicaciones en revistas arbitradas, entonces se eliminaría una de sus preocupaciones principales y con esto se fomentaría la publicación de información y el acceso libre a la misma.
Figura 1. Elementos del Marco de Publicación de datos (A) y componentes centrales técnicos y de infraestructura del mismo (B) (tomado de Chavan VS y Ingwersen P, 2009).

Aunado a lo anterior es necesario fomentar un cambio de actitud en los publicadores de información científica, sociedades científicas, investigadores y agencias de financiamiento y gubernamentales para lograr que el acceso libre a la información primaria se convierta en una realidad en el corto plazo.

Artículo de referencia:
ResearchBlogging.org
Chavan, V., & Ingwersen, P. (2009). Towards a data publishing framework for primary biodiversity data: challenges and potentials for the biodiversity informatics community BMC Bioinformatics, 10 (Suppl 14) DOI: 10.1186/1471-2105-10-S14-S2

viernes, 12 de febrero de 2010

Hombre de cabello obscuro y grueso, con ojos cafés y una tendencia a la calvicie invade los medios 4 mil años después de muerto

Para haber vivido hace muchos años se sabe bastante sobre él. Por medio de varios detallados y cuidadosos estudios, un grupo de 52 autores liderados por Eske Willerslev de la Universidad de Copenhague, presentaron en la edición del día de ayer de la revista Nature (doi:10.1038/nature08835) los resultados de un estudio de ADN humano con una antigüedad alrededor de 4 mil años.

Los cabellos, de los que se obtuvo la muestra, fueron encontrados hace mas de 10 años en el suelo helado de Qeqertasussuk, en Groenlandia y pertenecieron a un hombre de la cultura Saqqaq. Este señor poseía, entre otras cosas, ojos color café, una piel que no era blanca, cabello obscuro y grueso, una tendencia a quedarse calvo y tipo de sangre A+.

Más allá de lo emocionante que resulta poder imaginarse a los habitantes antiguos y sus relaciones tanto con otros grupos antiguos como contemporáneos, los resultados y el trabajo alrededor del hallazgo son interesantes por varias razones.

Primero que nada, la muestra de cabello tenía un grado de contaminación muy bajo. Uno de los problemas con los tejidos antiguos es que suelen estar muy contaminados con hongos y/o bacterias, haciendo que ciertos análisis no sean posibles. En el caso de este norteño espécimen, por lo menos el 80% de la muestra correspondía a ADN humano que además no había sido contaminado con ADN humano contemporáneo (otro problema potencial con este tipo de muestras).

Segundo, gracias a la información disponible como resultado del proyecto del genoma humano y al consecuente desarrollo de herramientas genómicas, fue posible comparar el genoma de este antiguo habitante del norte americano con el de poblaciones geográficamente cercanas. Como resultado, se encontró que éste estaba mas relacionado con poblaciones de la parte ártica del viejo continente (específicamente losNganasans, Koryaks y los Chukchis) que con otros grupos del nuevo mundo (como grupos Amerindios, Na-Dene o con los Inuit). Es decir, las herramientas forenses y genómicas de última generación permitieron “reconstruir” a este antiguo habitante, así como hacer inferencias sobre su origen etnográfico.

Tercero, esta extraordinaria muestra -y los detallados análisis que fueron posibles gracias a su excelente estado- ha permitido enriquecer la genómica humana moderna ya que una de las restricciones de este campo de investigación es precisamente que nos dice poco acerca de la diversidad genética en poblaciones antiguas así como sobre sus relaciones. Es decir, no podemos saber con precisión las relaciones entre grupos humanos contemporáneos si desconocemos cuales fueron las relaciones en el pasado.

Las características de la muestra del señor en cuestión, permitieron hacer todos estos análisis y hacer interesantes inferencias. Sin embargo, la mayoría de los restos humanos antiguos son encontrados en ambientes templados e incluso cálidos y dado que la tasa de degradación del ADN se incrementa con la temperatura, la mayoría de las veces no es posible hacerles pruebas tan bonitas. Por lo tanto, uno de los retos que enfrenta la paleogenómica actual es la posibilidad de hacer análisis similares con muestras no congeladas.

Por otro lado, Warhol tenía razón, todos podemos tener 15 minutos de fama, aunque tarden en llegar 4 mil años.

Artículo de referencia:
ResearchBlogging.org
Rasmussen, M., Li, Y., Lindgreen, S., Pedersen, J., Albrechtsen, A., Moltke, I., Metspalu, M., Metspalu, E., Kivisild, T., Gupta, R., Bertalan, M., Nielsen, K., Gilbert, M., Wang, Y., Raghavan, M., Campos, P., Kamp, H., Wilson, A., Gledhill, A., Tridico, S., Bunce, M., Lorenzen, E., Binladen, J., Guo, X., Zhao, J., Zhang, X., Zhang, H., Li, Z., Chen, M., Orlando, L., Kristiansen, K., Bak, M., Tommerup, N., Bendixen, C., Pierre, T., Grønnow, B., Meldgaard, M., Andreasen, C., Fedorova, S., Osipova, L., Higham, T., Ramsey, C., Hansen, T., Nielsen, F., Crawford, M., Brunak, S., Sicheritz-Pontén, T., Villems, R., Nielsen, R., Krogh, A., Wang, J., & Willerslev, E. (2010). Ancient human genome sequence of an extinct Palaeo-Eskimo Nature, 463 (7282), 757-762 DOI: 10.1038/nature08835