Investigadores ‘rejuvenecen’ hojas de herbario con Inteligencia Artificial
Sistema es capaz de colorear la imagen y rellenar huecos en las hojas
Publicaron artículo en edición especial de la IEEE Latinoamérica sobre Inteligencia Artificial para la Sostenibilidad
Desde hace años los investigadores del TEC que se han enfocado en el campo de la informática para la conservación de la naturaleza sueñan con crear un sistema que dé vida a los millones de pliegos de herbarios que existen en el mundo. Ahora, –bajo la autoría de Esteban Esquivel Barboza, estudiante de la Maestría en Computación, y su asesor de tesis, el Dr. José Mario Carranza Rojas– un paper demuestra técnicas cercanas a ese sueño.
“Los pliegos de herbario se secan, suelen tener huecos y otras formas de ruido, que un algoritmo que pudiese rejuvenecerlas tendría que rellenar. Podríamos decir que tendría que alucinar o imaginar el contenido de los huecos, así como repintar la planta completamente”, explica Carranza.
El artículo científico, titulado "Senescence Reversion in Plant Images Using Perception and Unpaired Data (Reversión de la senescencia en imágenes de plantas usando percepción y datos no apareados)” y publicado en la edición especial del journal de IEEE sobre Inteligencia Artificial para la Sostenibilidad, detalla la ruta que tomaron los investigadores para convertir fotos de pliegos de herbario en fotos de plantas frescas.
La mayor novedad es que lograron entrenar el modelo sin tener fotos totalmente apareadas. Es decir, sin imágenes de cómo se veían las plantas vivas en contraste con la imagen de herbario. Esto es de gran importancia, ya que es muy difícil conseguir las fotografías de las plantas (incluso pueden ser especies extintas), pero las colecciones de herbarios abundan en el mundo, incluso muchas están en línea.
“El principal logro se podría resumir en demostrar la posible utilidad para el aumento de datos usando modelos generativos de aprendizaje automático, y datos sin pares, en el área de imágenes de plantas. Hasta donde sabemos, este es el tercer trabajo publicado relacionado a técnicas generativas con uso de imágenes de herbario y el segundo en el área de reversión de la senescencia”, comenta Esquivel.
Para esta etapa de la investigación utilizaron cerca de 200 especies de plantas de Costa Rica. Por ahora se enfocaron nada más en las hojas de las plantas, ya que es el órgano mejor conservado y con mayor frecuencia encontrado en las imágenes de pliegos de herbario.
“Nuestro modelo entonces toma dos fotos de la misma especie, no del mismo espécimen o planta individual, una de herbario y una fresca, y aprende a traducir la de herbario en la fresca, y viceversa. Es decir, es un modelo doble, bidireccional”, ahonda Carranza.
“Creo que el TEC tiene la ventaja que hay apoyo de diferentes tipos para la investigación científica en muchas ramas. Este apoyo genera investigaciones y proyectos atractivos con ayuda de investigadores. Todos estos sirven de base e inspiración para el estudiantado, despertando en algunos de ellos un interés, haciendo que se involucren en estas actividades para aportar y crecer colectiva e individualmente. Este ambiente es el que propicia que se dé generación de conocimiento nuevo constantemente”.Esteban Esquivel Barboza, Estudiante Maestría en Computación.
Además de esta contribución en el uso de datos sin pares, los investigadores también utilizaron técnicas de percepción que mejoran la calidad de la imagen generada y ayudan a que se sienta más realista.
“Evaluamos las fotos generadas o alucinadas, con un modelo de identificación de plantas real, y lo que notamos es que para un 73% de las especies evaluadas, las fotos alucinadas permiten entrenar modelos de clasificación de forma satisfactoria, permitiendo una reducción máxima 20% en exactitud, y en algunos casos, sin reducción. Esto quiere decir que, en ausencia de imágenes frescas, es posible utilizar las imágenes alucinadas, siendo esto mejor que no tener ninguna del todo”, adujo Carranza.