El estudio de los organismos se ha beneficiado de técnicas de generación de imágenes que revelan detalles no aparentes al ojo humano. Un tipo clásico de imágenes médicas se obtiene, por ejemplo, a través del uso de rayos X, generando imágenes que revelan detalles de tejidos internos. Tecnologías más contemporáneas, como la resonancia magnética, permitieron explorar tejidos y moléculas internas a los organismos en tres dimensiones.
Adicionalmente, microscopios que utilizan electrones para revelar detalles a escalas pequeñas nos permiten estudiar moléculas de bajo nivel que conforman los organismos. En general, los campos relacionados con ciencias de la vida poseen herramientas para explorar los detalles estructurales de los organismos a diferentes niveles de detalle, dependiendo del objeto de estudio, aunque no todas han sido depuradas al mismo nivel.
Las tecnologías para explorar tejidos de gran tamaño han sido maduradas por mucho más tiempo que sus contrapartes microscópicas. No fue sino hasta tiempos relativamente recientes que se ha enfocado el desarrollo de las mismas. Las imágenes generadas por estos nuevos microscopios empezaron a consolidarse al inicio de la década en una base de datos pública llamada EMDB (Electron Microscopy Data Bank). Existe, en este momento, una necesidad de herramientas de búsqueda avanzadas sobre este tipo de base de datos de imágenes. Muchas de las herramientas de búsqueda dependen de la anuencia que tengan los autores de las imágenes de agregar anotaciones textuales a la base de datos. De esta forma, otros investigadores pueden realizar búsquedas por "palabras clave" que correspondan a las anotaciones. Sin embargo, una manera más robusta de búsqueda debería basarse en las características estructurales de las imágenes.
La presente propuesta busca crear algoritmos de búsqueda utilizando características estructurales, enfocados en características locales (i.e. detalles en regiones pequeñas de una imagen completa). Si bien es cierto, comparar la estructura completa de dos imágenes es una manera válida de abordar el problema, las imágenes pueden contener decenas de biomoléculas juntas, que pueden aparecer individualmente en otras imágenes en la base de datos. Adicionalmente, esto permitiría a los usuarios de un sistema de búsqueda de este tipo proveer una imagen correspondiente a una sola biomolécula y encontrar ocurrencias de ésta en diferentes imágenes en la base de datos, independientemente si aparece en su totalidad o como un segmento de la misma.
Si bien es cierto la primera área de aplicación para un motor de búsqueda de este tipo es a nivel de biomoléculas con algunas decenas de proteínas, esto puede evolucionar a imágenes de mayor tamaño como, por ejemplo, tomografías de electrones. Los mismos principios de identificación y búsqueda descritos pueden aplicarse a búsqueda de secciones de tejidos. Al llegar a este nivel de análisis, nos acercamos mucho más a lo que en este momento se conoce como "análisis de imágenes médicas". Por ejemplo, el sistema podría ser entrenado para identificar cúmulos de células degeneradas (relacionado cáncer) en lugar de identificar pequeñas proteínas.
Periodo del proyecto: del 1 de enero de 2019 al 31 de diciembre de 2022