Redes neuronales engañadas por ilusiones ópticas de la misma manera en que se engaña a los humanos

En los tres casos, la Sagrada Familia es del mismo color pero se ve diferente debido a los colores circundantes. Esta es una ilusión visual.

¿Las redes neuronales sueñan con ilusiones visuales?

Ésta es la cuestión que estudian los investigadores del Departamento de Tecnologías de la Información y las Comunicaciones, que lidera Marcelo Bertalmío junto con Jesús Malo, investigador de la Universidad de Valencia.


Una red neuronal convolucional es un tipo de red neuronal artificial en la que las neuronas se organizan en campos receptivos de una manera muy similar a las neuronas en la corteza visual de un cerebro biológico. Hoy en día, las redes neuronales convolucionales (CNN) se encuentran en una variedad de sistemas autónomos (por ejemplo, detección y reconocimiento de rostros, vehículos autónomos, etc.). Este tipo de red es muy eficaz en muchas tareas de visión artificial, como en la segmentación y clasificación de imágenes, junto con muchas otras aplicaciones.

Las redes convolucionales se inspiraron en el comportamiento del sistema visual humano, en particular su estructura básica formada por la concatenación de módulos compuestos que comprenden una operación lineal seguida de una operación no lineal. Un estudio publicado en la edición avanzada en línea de la revista. Investigación de la visión examina el fenómeno de las ilusiones visuales en redes convolucionales en comparación con su efecto sobre la visión humana. Un estudio de Alexander Gómez Vila, Adrián Martín, Javier Vázquez-Corral y Marcelo Bertalmío, miembros del Departamento de Tecnologías de la Información y la Comunicación (DTIC) con la participación del investigador Jesús Malo de la Universidad de Valencia.


“Debido a esta conexión de las CNN con nuestro sistema visual, en este artículo queríamos ver si las redes convolucionales sufren problemas similares a nuestro sistema visual. Por tanto, nos centramos en las ilusiones visuales. Las ilusiones visuales son imágenes que nuestro cerebro percibe de forma diferente a como son en realidad ”, explica Gómez Vila, primer autor del estudio.

En su estudio, los autores capacitaron a CNN para tareas simples que también realiza la visión humana, como eliminar ruido y desenfocar. Lo que observaron es que estos CNN entrenados en estas condiciones experimentales también son “engañados” por ilusiones visuales de brillo y color de la misma manera que las ilusiones visuales engañan a los humanos.

Además, como explica Gómez Villa, “para nuestro trabajo también analizamos cuando tales ilusiones provocan respuestas en la red que no son las físicamente esperadas, pero tampoco coinciden con la percepción humana”, es decir, casos en los que las CNN obtienen un ilusión óptica diferente a la ilusión que percibirían los humanos.

Los resultados de este estudio son consistentes con la hipótesis de larga data que considera las ilusiones visuales de bajo nivel como un subproducto de la optimización a los entornos naturales (que un humano ve en su día a día). Mientras tanto, estos resultados destacan las limitaciones y diferencias entre el sistema visual humano y las redes neuronales artificiales de CNN.

Referencia: “Las ilusiones de color también engañan a las CNN para tareas de visión de bajo nivel: análisis e implicaciones” por A. Gomez-Villa, A. Martín, J. Vazquez-Corral, M. Bertalmío y J. Malo, 4 de septiembre de 2020, Investigación de la visión.
DOI: 10.1016 / j.visres.2020.07.010

Pilar Benegas

Pilar Benegas es una reconocida periodista con amplia experiencia en importantes medios de USA, como LaOpinion, Miami News, The Washington Post, entre otros. Es editora en jefe de Es de Latino desde 2019.