Visita a la Smart Room con el Grupo de Procesamiento de Imagen de la UPC

El miércoles de la semana pasada desde la rama del IEEE de la Universitat Politècnica de Catalunya se organizó una visita a la sala Smart Room del Campus Nord de Barcelona.

El profesor Josep Ramon Casas y el técnico Albert Gil prepararon una presentación interactiva para una quincena de estudiantes de la Escola Tècnica i Superior de Telecomunicacions de Barcelona, en la que se trataron algunos temas en los que está trabajando el Grupo de Procesamiento de Imagen.

Presentación GPI UPC

¿Qué es una Smart Room?

Una Smart Room es, como dicen las palabras en inglés, una sala inteligente.

Es una sala equipada con equipos que recogen información sobre las personas que se encuentran en su interior, analizan los datos recibidos e interactúan con el usuario. Este tipo de salas están concebidas principalmente para obtener nuevas experiencias, ya sean de carácter educativo como de carácter lúdico.

¿En qué está trabajando el Grupo de Procesamiento de Imagen de la UPC?

El GPI es un grupo de investigación muy amplio que investiga una temática bastante diversa. En la charla, sin embargo, se trataron los temas más directamente relacionados con lo que entendemos por “televisión del futuro“, es decir, ir más allá de la televisión tradicional y buscar maneras de innovar en este campo.

A lo largo de la presentación pudimos ver, especialmente, tres funcionalidades significativas que me interesaron.

Reconocimiento de objetos en movimiento dentro del Smart Room

En el momento que una persona entra en la Smart Room, las diferentes cámaras comienzan a procesar todas las imágenes que están recibiendo en diferentes ordenadores, de tal forma que, entre ellas se crea una nube de puntos que identifica la superficie de la persona en todo el espacio tridimensional de la sala.

De esta forma, podemos modelar cualquier objeto que haya dentro y, de este modo, podemos crear una cámara virtual desde cualquier punto de la sala, lo que nos permitiría ver los objetos totalmente en tres dimensiones, colocándonos donde deseemos.

Presentación GPI UPC

Conjunto de cámaras calibradas para retransmisión en 180º

El Grupo de Procesamiento de Imagen de la UPC también está trabajando actualmente en un proyecto a nivel europeo en la que se plantean diferentes posibilidades a la hora de utilizar la televisión en el futuro. La idea es usar un conjunto de ocho cámaras de alta definición bien calibradas de forma que se pueda obtener una imagen con un ángulo de visión de 180º con una definición excelente.

De esta forma, podemos movernos por todo el conjunto de visión que tendría aproximadamente una persona humana. Por ejemplo, podríamos ver una obra de teatro como si estuviéramos sentados frente al escenario o un partido de fútbol como si estuviéramos sentados en el estadio. ¿No sería increíble?

Gestión de interfaces de usuario sin mando a distancia

Hasta ahora, para controlar la televisión, ya sea desde el sofá de casa como en un ordenador, utilizamos dispositivos como pueden ser un mando a distancia o el teclado y el ratón, interfaces de usuario que, aunque están muy implantados, no son del todo intuitivos y podrían mejorarse muchísimo con herramientas de procesamiento de imagen.

La gracia de tener un conjunto de cámaras de alta definición de manera que tengamos todo el rango de 180ª es poder movernos de la manera más sencilla posible, así que el trabajo del Grupo de Procesamiento de Imagen es justamente este: conseguir encontrar la mejor manera para moverse por la escena.

La opción que parece más efectiva es, sin duda, poder interactuar sin la necesidad de disponer de ningún mando a distancia, ratón, teclado… Cuanto más fácil, mejor, así que qué mejor manera que tener una cámara que capte nuestros movimientos y los identifique con cierta orden? Un ejemplo ya disponible, aunque en versión alpha, es el aplicación Flutter, que nos permite gestionar iTunes y Spotify mediante la cámara de nuestro ordenador (Mac o PC):

En el caso de la interfaz de usuario desarrollada por la UPC, si nos colocamos delante de la pantalla y empezamos a hacer algunos de los símbolos que la cámara identifica, empezará a hacer las acciones correspondientes. Podemos subir y bajar el volumen o silenciarlo, podemos acercarnos haciendo zoom en una zona de la imagen, mover la mano como si moviéramos la cabeza cambiando el ángulo de visión o detener la reproducción. Incluso se podría hacer, por ejemplo, una función que persiguiese la pelota a lo largo de todo el partido.

¿Qué te parece? Seguro que ya se te están ocurriendo mil y una maneras de aprovechar toda esta investigación en proyectos relacionados con la televisión.

Publicado en Tecnología y etiquetado , , .