Archivado - Presentamos la cámara Intel® RealSense™ R200 (de cara al mundo)

Intel® RealSense™ SDK ha sido discontinuado. No habrá más actualizaciones ni continuará la asistencia.

La nueva cámara 3D Intel® RealSense™ que pronto estará entre nosotros es la R200 - de cara al mundo. El SDK de Windows* 10 de 64 bits (y Windows 8.1 de 64 bits) ya se lanzó en su versión beta en el SDK de Intel® RealSense™ R3 (v5.0.3). Y lo más probable es que el SDK de Android v5 aparezca en los próximos meses.

La R200, de aproximadamente 102 x 9,5 x 3,8 mm, vendrá integrada en algunas tabletas electrónicas y sistemas 2 en 1 que deberían llegar al mercado en las fiestas de 2015. Hay una versión externa con conexión USB3 (de 130 x 20 x 7 mm) y los desarrolladores podrán recibir notificaciones cuando comiencen a recibirse pedidos en http://click.intel.com.

La R200 tienen en realidad tres cámaras que brindan información RGB (color), y también infrarroja estereoscópica para la profundidad. Con la ayuda de un proyector láser, la cámara hace escaneos 3D para captar escenas y mejorar la fotografía. La distancia entre el lente y el objeto debe ser de entre 0,5 y 3,5 metros en interiores, y puede llegar a los 10 metros al aire libre. Este valor depende mucho del módulo y la iluminación. Las distancias correspondientes a los diferentes algoritmos de las cámaras F200 y R200 se especifican en la documentación en línea.

A diferencia de la cámara Intel® RealSense™ F200, el modelo R200 no se centra en el usuario, sino en el mundo. Por lo tanto, el SDK de RealSense apunta a los siguientes usos de la R200.

  1. Capturar el mundo en 3D y luego editar, compartir e imprimir los objetos en 3D.
  2. Mejorar las fotografía. Incluye filtros 3D para modificar la iluminación y el enfoque, y segmentar el fondo (eliminarlo o sustituirlo).
  3. Agregar contenido virtual a capturas 3D del mundo físico. Con la función Scene Perception, se pueden agregar objetos virtuales a las escenas capturadas del mundo real, gracias a que la cámara R200 entiende las superficies, las formas y el movimiento, y es capaz de crear escenas a partir de cálculos de la posición u orientación de la cámara.

Los usos que mencionamos se basan en dos aspectos del funcionamiento de las cámaras R200.

  • Seguimiento y localización: cálculo en tiempo real de la posición y la orientación de la cámara a partir de datos de profundidad, RGB y de la unidad de medición inercial (IMU).
  • Reconstrucción de superficies y volúmenes 3D: representación digital en tiempo real de la escena tridimensional que capta la cámara.

Algunas de las funcionalidades que incluía el SDK de Intel RealSense para Windows del modelo F200 se irán agregando con el tiempo. No hay que olvidar que el SDK R3 para la F200 todavía es apenas la versión beta del SDK para la R200. La versión alfa del SDK para la R200 (el R2 del SDK para la F200) detectará rostros, posición y orientación. La detección de rostros funciona a una distancia de hasta 2,5 m, mientras que para la posición y orientación, la distancia máxima será de 1,5 m. La versión beta R3 agrega seguimiento de blobs y puntos de referencia de rostros (1 metro). Las funcionalidades para Android tendrán un SDK aparte y todavía no se han publicado.

Mientras que el SDK de RealSense para Windows lo comparten ambos modelos de cámara y contiene documentación y ejemplos para los dos, la R200 necesita un paquete de firmware y DCM diferente. La R200 usa la serie DCM 2.x, mientras que la F200 utiliza DCM 1.x.

Uno de los aspectos que más entusiasman de la cámara R200 es la capacidad de hacer escaneos más grandes y el nuevo método para medir la profundidad. Tiene cámaras estereoscópicas además de la RGB. Y como no depende tanto de los datos infrarrojos, se puede usar al aire libre. La cámara a color captura las imágenes para los seres humanos y las dos cámaras de profundidad proporcionan los datos que emplearán los algoritmos. Además, si el sistema cuenta con una unidad de medición inercial integrada, el SDK puede ajustar el efecto de la gravedad en los objetos que se agregan a la escena.

En la fotografía estereoscópica, la profundidad o tridimensionalidad se calculan a partir de la disparidad (cambio en los píxeles) entre dos cámaras mediante triangulación. Esto se basa en el plano paralelo (no la totalidad de lo que puede capturar la cámara). El SDK incluye una utilidad que ayuda con la detección de planos. Asegurarse de que la cámara pueda “ver” el horizonte durante la inicialización es esencial para determinar la orientación del objeto que se escanee.

La R200 sigue el movimiento de la cámara en el espacio tridimensional con 6 grados de libertad: 3 grados correspondientes a atrás/adelante/abajo/arriba y 3 grados de movimientos alrededor de los ejes espaciales (guiñada/cabeceo/alabeo).

Consejos para obtener los mejores resultados del escaneo 3D:

  • Usar un campo de visión (cúbico) de 2 m, con al menos 5000 píxeles (640 × 480). El siguiente es un cuadro de consulta para la detección:
    Dist. / mín.    Tamaño de objeto rectangular
     30 cm                  4,5 cm × 3,5 cm
    100 cm                 16 cm × 11 cm
    180 cm                 28 cm × 21 cm
  • No ocluir más del 20 % de un objeto.
  • Se puede mover la cámara, pero el objeto real debe estar lo más quieto posible.
  • Usar 30 fps o 60 fps (consultar el cuadro de más adelante). Los valores más altos son mejores para que los desplazamientos entre fotogramas sean más pequeños.
  • No usar superficies planas, sin estructura. El proyector infrarrojo envía un patrón aleatorio no uniforme de luz para agregar textura a la escena y pasa los datos por los filtros de banda infrarroja. Se agrega más información RGB para los cálculos de profundidad.
  • Mover la cámara a velocidad entre baja y moderada. Hay que tener presente que filmar a 60 fps implica 18 M de cálculos de profundidad por segundo.
  • Dejar a la cámara el tiempo necesario para inicializarse (se muestra en la parte inferior izquierda de la pantalla), lo cual incluye centrar el objeto con las líneas verdes.

La cámara a color es capaz de ofrecer RGBA de 32 bits en 1080p a 60 fps con foco fijo y una relación de aspecto de 16:3. La cámara RGB tiene un campo de visión ligeramente más grande que las otras dos, pero no fue ideada para usarla como cámara única.
Las dos cámaras de profundidad tienen una relación de aspecto de 4:3 con foco fijo y un campo de visión de 70 × 59 × 46 grados.
El infrarrojo es un láser clase 1 de 850 nm.
Resoluciones disponibles:
A 60 fps, con profundidad en 320 × 240, el color puede ser de 640 × 480
A 60 fps, con profundidad en 480 × 360, el color puede ser de 320 × 240 o 640 × 480
A 30 fps, con profundidad en 320 × 240, el color puede ser de 640 × 480, 1280 × 720 o 1920 × 1080
A 30 fps, con profundidad en 480 × 360, el color puede ser de 320 × 240, 640 × 480, 1280 × 720 o 1920 × 1080

El SDK de RealSense proporciona interfaces para proyectar profundidad en el color y viceversa.

La potencia de dibujo de la R200 varía entre 0 y 100 mW (inactiva) y entre 1,0 y 1,6 W cuando está activa (depende de los módulos que se utilicen). Tiene varias prestaciones de ahorro de energía, entre ellas las ráfagas de datos por USB3.

El SDK incluye compatibilidad de Unitiy con la R200 (Unity 4.x es de 32 bits y Unity 5.x es de 64 bits, por lo cual hay que agregar al proyecto las bibliotecas correspondientes; además, se puede usar Unity personal, no profesional, siempre y cuando se incluyan las bibliotecas firmadas en el proyecto).

Acerca del autor

Colleen Culbertson es ingeniera de aplicaciones y trabaja en la División de Relaciones con los Desarrolladores de Intel.

Para conocer más acerca de la Tecnología Intel® RealSense:
www.intel.com/software/realsense

Para obtener información más completa sobre las optimizaciones del compilador, consulte nuestro Aviso de optimización.