Datos abiertos
"Los datos de agrobiodiversidad están ligados a los derechos de los pueblos, y deben ser un referente para las decisiones que toman los pueblos sobre su territorio."
Fernando Alejandro Mondragón Galicia - Proyecto de colecta RG078
Las bases de datos del SIAgroBD contienen información biológica y geográfica sobre especies de la agrobiodiversidad, información nutricional, mediciones agronómicas y datos cualitativos relacionados con los usos de las especies y la percepción de las comunidades locales. Integramos datos de instituciones socias, por ejemplo la Tabla de composición de alimentos del Instituto Nacional de Ciencias Médicas y Nutrición Salvador Zubirán. También hay datos de proyectos previos gestionados por CONABIO, como los resultados del Proyecto Global de Maíces Nativos, en una versión extendida, accesible y vinculada al resto de los datos de la CONABIO. Por último, se recopilaron datos nuevos como parte del Proyecto Agrobiodiversidad Mexicana, como las colectas GEF y los grupos de enfoque.
El SIAgroBD publica
datos abiertos, es decir, datos que son puestos a disposición para que puedan ser usados, reutilizados y redistribuidos libremente por cualquier persona, en cualquier momento y en cualquier lugar. Además cumplen con los
principios FAIR: es decir, fáciles de encontrar, accesibles, interoperables y reutilizables.
Herramientas computacionales
"Me encanta la versión de campo [de Kobotoolbox], como técnico de campo me facilita mucho el trabajo, ya que con la toma de muestras, las fotos y atendiendo la información que nos brindan los guías, el tener una versión ligera de las preguntas, es una maravilla."
Participante de los proyectos de colecta GEF
Las herramientas computacionales son el software que hace funcionar el SIAgroBD. Estas herramientas permiten hacer más eficiente, reproducible y transparente el proceso de colectar, capturar, revisar, integrar y publicar los datos relacionados con la agrobiodiversidad.
Colecta digital de datos con KoboToolbox
Utilizamos
Kobotoolbox para recolectar los datos que se generaron como parte del Proyecto Agrobiodiversidad Mexicana. Kobo permite recopilar datos en campo a través de formularios estandarizados en versión web, o a través de teléfonos inteligentes con o sin conexión a Internet. Para tener mayor control sobre los datos, instalamos
Kobo en los servidores de la CONABIO.
Integración de datos con Zendro y Zacatuche
Para vincular los datos del SIAgroBD con el resto de los datos del
Sistema Nacional de Información de Biodiversidad (SNIB) de la CONABIO, así como para hacerlos públicos, utilizamos
Zendro y
Zacatuche, los cuales están basados en GraphQL. Zendro fue desarrollado por la Coordinación de Agrobiodiversidad y Recursos Biológicos de la CONABIO en colaboración con el Forschungszentrum Jülich de Alemania. Zacatuche fue desarrollado por la Dirección de Ciencia de Datos sobre Biodiversidad de la CONABIO.
Visualización de datos en Enciclovida y aplicaciones dinámicas
Conectar los datos del SIAgroBD con otras bases de datos de CONABIO permite explorar la información completa de las
especies de la agrobiodiversidad a través de Enciclovida. Además, los datos específicos de agrobiodiversidad se pueden explorar en las
visualizaciones dinámicas que desarrollamos mediante herramientas de código abierto, principalmente Shiny R y dash.
Colaboración
"Fue muy grato ver el interés por acercarse a quienes recopilamos la información. Así, la calidad de los datos se incrementará mucho y será más confiable para todos."
Participante del taller sobre datos abiertos
Gestionar datos es gestionar una comunidad
Los datos del SIAgroBD existen gracias al trabajo en campo y en escritorio de centenas de personas, así como a la participación de miles de personas del campo mexicano que aportaron información y consintieron que se publicara. Las herramientas computacionales también requieren atención y mantenimiento continuo por personas con conocimientos técnicos. Por eso, la colaboración, los acuerdos entre personas y la creación de capacidades son tan importantes como los componentes técnicos para el funcionamiento del SIAgroBD.
Acuerdos de colaboración
El tipo de información que se generó para las colectas del Proyecto Agrobiodiversidad Mexicana se definió de forma conjunta entre personal de la CONABIO y personas externas expertas en agrobiodiversidad. Así, equipos muy diversos, enfocados en diferentes regiones de México o grupos de plantas, pudieron recolectar información utilizando formularios estandarizados. Acuerdos similares ocurrieron para otros tipos de datos, como los Grupos de Enfoque y las Canastas Regionales del Bien Comer, donde además participaron personas expertas en ciencias sociales o nutrición y personas de las comunidades donde se colectaron los datos.
Algunos datos publicados en el SIAgroBD fueron generados por otros proyectos o instituciones externas. En algunos casos fue necesario firmar convenios institucionales, limpiar y transformar los datos a un formato adecuado. Incorporar estos datos al sistema también involucra el trabajo de muchas personas, desde quienes están familiarizadas con los datos hasta quienes manejan los programas computacionales y quienes asesoran jurídicamente para llegar a los convenios de colaboración.
Acuerdos para la publicación de los datos
Durante los proyectos de colecta del Proyecto Agrobiodiversidad Mexicana se preguntó a las personas que donaron la información en campo si estaban de acuerdo en hacer pública la información y usarla para investigación y materiales de difusión. En el SIAgroBD sólo se muestran los datos que las personas donantes autorizaron para su publicación. Así mismo, se acordó con los grupos de colecta oscurecer la localización exacta de algunas especies de las colectas GEF debido a que son especies amenazadas o existe una preocupación por el saqueo.
Estándares de datos
Los datos del SIAgroBD incluyen variables adicionales a la información biológica y geográfica del
SNIB. Por ejemplo, en el SIAgroBD se incluye información nutrimental, variables agronómicas como la longitud o el color de una mazorca de maíz, o información que permite distinguir si una planta es silvestre, domesticada o arvense. Estos datos son muy distintos entre sí, por lo tanto sistematizarlos y vincularlos con el resto de la información de la CONABIO requiere adaptar los estándares de datos a nuevos modelos y vocabularios controlados. Durante el proceso de revisión de calidad de los datos, personal de la CONABIO retroalimenta a los equipos de colecta para que los datos se ajusten a los estándares definidos.
Desarrollo de capacidades
Como parte del SIAgroBD se promueve el desarrollo de capacidades para el uso de las herramientas computacionales y de los datos. Brindamos capacitaciones sobre el uso de KoboToolbox; organizamos
talleres para introducir los datos abiertos y espacios de intercambio de experiencias sobre el uso de las herramientas; generamos manuales y
documentación. A través de procesos de retroalimentación con las personas usuarias, continuamos aprendiendo y mejorando los procesos de generación, publicación y uso de datos abiertos del SIAgroBD.