Descubriendo los rasgos usados por algoritmos de Deep Learning en la identificación de taxonas de plantas

Imagen con fines ilustrativos

Se plantea el uso de redes neurales de deconvolución y otras técnicas para descubrir los rasgos más determinantes usados por algoritmos de deep learning con CNN (redes neurales convolucionales) en la identificación de taxones (especies, géneros y familias) usando como referencia algunas especies de plantas de Costa Rica.

Los principales beneficiarios serán los taxónomos botánicos, es decir, los científicos que constantemente hacen identificaciones mediante claves de identificación y que podrán contar con CNN que no solamente sean efectivas sino que tienen un componente explicativo, por lo cual hay una mejoría potencial en dos direcciones. Por un lado, se pueden enriquecer sus caracteres diagnósticos con rasgos no detectados previamente pero que la red neuronal sí podría haber detectado.

Por otro lado, se podría mejorar la precisión de la red (algoritmo) si hay rasgos que la red no detecta pero los taxónomos han usado tradicionalmente como caracteres diagnósticos. En segunda instancia, se benefician los procesos de curación de datos en herbarios y, por lo tanto, el flujo de trabajo científico que lleva a la identificación eficiente de especies. Esto es fundamental por la actual propensión a errores, su lentitud y por la carencia de suficientes taxónomos para hacerlo.

 

Periodo del proyecto: 1 de enero del 2019 al 31 de diciembre del 2020