Una cámara que ve como el ojo humano
La nueva arquitectura informática desarrollada por IBM, que funciona como el cerebro, allana el camino para un nuevo tipo de visión artificial.
La retina es una herramienta tremendamente potente. Filtra una cantidad ingente de datos operando con una fracción de la energía que necesitarían una cámara digital y un ordenador para hacer la misma labor.
Ingenieros de una empresa suiza llamada iniLabs están aplicando las lecciones aprendidas de la biología en un esfuerzo por construir una cámara digital más eficiente inspirada en la retina humana. Al igual que las neuronas individuales de nuestros ojos, la nueva cámara, bautizada Dynamic Vision Sensor (DVS), solo responde a los cambios en una escena dada. Este método elimina grandes cantidades de datos redundantes y podría resultar útil en numerosos campos, entre ellos la vigilancia, la robótica y la microscopía.
"Tu ojo y el mío también son cámaras digitales. Simplemente son otra clase de cámara digital", sostiene Tobi Delbruck, director científico de iniLabs. "Teníamos la mejor visión artificial posible con la arquitectura y el hardware existentes. Pero comparado con la biología, la visión artificial es lamentable".
Una cámara normal recoge todo lo que ve, almacenando la información para procesarla posteriormente. Esto consume mucha energía y mucho espacio. Las neuronas del ojo, sin embargo, solo se disparan cuando notan un cambio, por ejemplo que una zona concreta de una escena se ilumina o se oscurece. La DVS imita esa selectividad, transmitiendo información solo en respuesta a un cambio en la escena. Algo que consume menos energía y deja menos información que procesar.
El punto fuerte de la cámara es la captura de movimiento, como las gotas de leche que se observan aquí.
Esta característica podría ser especialmente útil para grabar escenas que no cambian demasiado. Por ejemplo, cuando los investigadores del sueño graban a sus sujetos, luego se ven obligados a cribar horas de metraje en las que no sucede nada. Con un sensor como la DVS, las porciones importantes, activas, de los datos desatacan automáticamente.
Los píxeles en la DVS también imitan la forma en que una neurona del ojo se calibra para una zona concreta: esa célula y las responsables de otra zona responderán a los datos entrantes de forma ligeramente distinta, así que una neurona puede ser muy sensible al input mientras que otras necesitarán un mayor estímulo para dispararse. De forma parecida, cada pixel de la DVS ajusta su propia exposición. Esto permite a la DVS manejar condiciones de luz desigual, aunque también implica la necesidad de píxeles enormes, 10 veces mayores que los de una cámara de móvil moderna.
La DVS está hecha para funcionar con la nueva arquitectura informática TrueNorth de IBM. TrueNorth es un método de programación que imita a la biología: la información se almacena, procesa y comparte en una red "neuromórfica" de chips de ordenador inspirada por las redes neuronales del cerebro.
"Esto de lo que hablamos --las cámaras que envían información cuando algo cambia-- es en realidad un tema fundamental en el funcionamiento del cerebro, o al menos en cómo creen los neurocientíficos que funciona", explica Nabil Imam, informático de la Universidad de Cornell que forma parte del equipo de la universidad que ha ayudado a IBM a desarrollar sus chips neuromórficos. "Estamos capturando características cerebrales a un alto nivel".
Delbruck y su equipo creen que al combinar su cámara con la arquitectura de TrueNorth, lograrán un dispositivo mejor para manejar problemas dinámicos en tiempo real.
La DVS se puede adquirir por 2.700 dólares (unos 2.000 euros) y ya se ha usado en varios proyectos de investigación, entre ellos uno que grababa el tráfico y otro que implicaba seguir partículas en un fluido. El equipo tiene previsto seguir mejorando el dispositivo. El próximo objetivo es añadir sensibilidad al color y aumentar la retina de la cámara de su resolución actual de 240x180.