
Se utiliza un sistema de visión artificial con cámaras estereoscópicas cuando se necesita que las máquinas vean el mundo en 3D. Las cámaras estereoscópicas ayudan a las máquinas a obtener percepción de profundidad, lo que les permite calcular la distancia a la que se encuentran los objetos. Esta capacidad marca una gran diferencia en la robótica, la automatización y otros sistemas de visión artificial. Hoy en día, la visión 3D y la percepción de profundidad impulsan cambios importantes en muchos sectores:
- La automatización y la robótica utilizan cámaras estéreo para una mejor percepción de la profundidad.
- Los nuevos sistemas de visión 3D ahora ofrecen mayor resolución y percepción más inteligente.
| Sector | Cuota de mercado |
|---|---|
| Automóvil | 40% |
| Industrial | 30% |
| Electrónica de consumo | 15% |
| Robótica médica | 10% |
| Agricultura | 5% |
Puntos clave
- Las cámaras estéreo brindan a las máquinas una visión 3D real al usar dos cámaras para medir la profundidad y la distancia, lo que ayuda a las máquinas a comprender su entorno mejor que cámaras 2D normales.
- La percepción precisa de la profundidad depende de calibración adecuada, la distancia entre cámaras (línea base), la resolución del sensor y buenas condiciones de iluminación.
- Los sistemas de visión estéreo funcionan comparando imágenes de dos cámaras para calcular la profundidad utilizando la disparidad, lo que permite realizar tareas precisas como la colocación de objetos, la medición de volumen y la navegación.
- En comparación con otras tecnologías 3D, las cámaras estéreo ofrecen una solución rentable con datos de color y profundidad y funcionan bien en exteriores y en muchos entornos, pero pueden presentar dificultades en escenas con poca luz o poca textura.
- Las cámaras estéreo se utilizan ampliamente en industrias como la automatización, la robótica, los ADAS y los campos médicos, proporcionando datos 3D en tiempo real que mejoran la seguridad, la precisión y la eficiencia.
Sistema de visión artificial con cámaras estéreo
¿Qué es una cámara de visión estéreo?
Se utiliza una cámara de visión estereoscópica cuando se desea que una máquina vea el mundo en tres dimensiones. Este tipo de cámara destaca porque utiliza dos o más sensores de imagen, similares a los propios ojos. Estos sensores capturan imágenes desde ángulos ligeramente diferentes. Al comparar estas imágenes, la cámara puede determinar la distancia a la que se encuentran los objetos. Este proceso permite a las máquinas comprender la percepción de profundidad, crucial para muchas tareas.
Las configuraciones de sistemas de visión artificial con cámaras estereoscópicas suelen utilizar sensores CCD o CMOS. Los sensores CCD ofrecen una buena calidad de imagen y un rendimiento óptimo con iluminación constante. Los sensores CMOS ofrecen mayor velocidad y consumen menos energía, lo que resulta útil en entornos con movimiento rápido. Algunos sistemas utilizan sensores microbolómetros para termografía, pero los CCD y CMOS se encuentran principalmente en configuraciones estándar. Estos sensores ayudan al sistema a recopilar información 3D detallada sin enviar señales adicionales, lo que los hace fiables para numerosas tareas de visión artificial.
Observará que los diseños de sistemas de visión artificial con cámaras estereoscópicas pueden ser pasivos o activos. Los sistemas pasivos utilizan únicamente la luz presente en la escena. Los sistemas activos añaden su propia luz, como la infrarroja, para facilitar la detección de profundidad en zonas oscuras o con poca textura. A diferencia de las cámaras 2D convencionales, las configuraciones de sistemas de visión artificial con cámaras estereoscópicas proporcionan datos 3D. Esto las hace perfectas para tareas como la medición de volúmenes, la comprobación de ensamblajes o la colocación de objetos con alta precisión.
Consejo: Si necesita una máquina para medir qué tan lejos está algo, elija una cámara de visión estéreo en lugar de una cámara 2D normal.
Cómo funciona la visión estereoscópica
La visión estereoscópica funciona copiando la forma en que tus ojos ven el mundo. Cada cámara del sistema toma una imagen desde un punto ligeramente distinto. Al observar estas dos imágenes, ves que los objetos aparecen en lugares distintos. Esta diferencia se llama disparidad. El sistema utiliza la disparidad para determinar la profundidad.
Así es como funciona el proceso:
- El sistema de visión artificial de cámaras estéreo captura dos imágenes al mismo tiempo.
- El sistema encuentra puntos coincidentes en ambas imágenes.
- Mide la diferencia horizontal entre estos puntos. Esta es la disparidad.
- Utilizando la disparidad, el sistema calcula la profundidad de cada punto.
Las matemáticas detrás de esto utilizan una fórmula:
Z = (focal length × baseline) / disparity
Aquí, Z representa la profundidad, la línea base la distancia entre las cámaras y la distancia focal la intensidad con la que el lente de la cámara enfoca la luz. Cuando la disparidad es grande, el objeto está cerca. Cuando la disparidad es pequeña, el objeto está lejos. Este método, llamado triangulación, permite al sistema generar un mapa de profundidad de la escena.
Los sistemas de visión estereoscópica requieren una calibración minuciosa. Es necesario alinear las cámaras y conocer sus posiciones exactas. Esto garantiza la precisión de los datos de profundidad. La distancia de referencia es fundamental. Una línea de referencia más grande facilita la medición de la profundidad de objetos lejanos, pero puede dificultar las mediciones de cerca. Una línea de referencia más pequeña funciona mejor para objetos cercanos, pero limita la distancia de visión en 3D.
- Una línea de base más grande aumenta la disparidad para objetos distantes, mejorando la precisión de profundidad a distancias más largas.
- Una línea de base más pequeña da mejores resultados para objetos cercanos pero reduce el rango de percepción de profundidad.
- La elección de la línea base depende de su aplicación y del tamaño del área que desea escanear.
Los sistemas de visión estereoscópica utilizan técnicas de coincidencia como la suma de diferencias al cuadrado (SSD) o la suma de diferencias absolutas (SAD) para encontrar los puntos correspondientes en las imágenes. Estos métodos ayudan al sistema a crear un mapa de profundidad fiable.
Percepción de profundidad en visión estereoscópica
La percepción de profundidad es la principal razón para usar un sistema de visión artificial con cámaras estéreo. Con dos imágenes, el sistema puede determinar la distancia a cada parte de la escena. Esta capacidad se denomina percepción de profundidad 3D y permite a las máquinas comprender el mundo de una forma que las cámaras 2D no pueden.
Cuando el sistema hace coincidir puntos entre las imágenes izquierda y derecha, crea una mapa de profundidadEste mapa muestra la distancia a cada punto visible. El sistema utiliza estos datos de profundidad para diversas tareas, como:
- Guiar a los robots para recoger objetos.
- Comprobación del encaje de las piezas en las líneas de montaje.
- Medir el volumen de los elementos en una caja.
- Navegar drones o vehículos de forma segura.
La mejor percepción de profundidad se obtiene cuando las cámaras están bien calibradas y la iluminación es adecuada. En entornos industriales, los sistemas de visión estereoscópica pueden alcanzar una precisión de profundidad de hasta 0.1 mm. Este nivel de precisión se logra mediante una calibración cuidadosa, una óptica de alta calidad y, en ocasiones, el uso de luz estructurada para facilitar la coincidencia.
La percepción de profundidad depende de varios factores:
- La distancia de referencia entre cámaras.
- La resolución de los sensores.
- La calidad de la calibración.
- Las condiciones de iluminación.
A sistema de visión artificial con cámaras estéreo Le ofrece una visión 3D real. Crea un mapa de profundidad que ayuda a las máquinas a tomar decisiones inteligentes. Esta tecnología se puede utilizar en robótica, automatización, inspección y muchos otros campos. El sistema proporciona datos de profundidad fiables y precisos, lo que lo convierte en un componente clave de la visión artificial moderna.
Nota: La percepción de profundidad mediante visión estereoscópica no se limita a ver en 3D. Se trata de dotar a las máquinas de la capacidad de interactuar con su entorno de forma segura y eficiente.
Características y tecnología
Línea base y calibración
Es necesario prestar mucha atención a línea base y calibración Al trabajar con tecnología de cámara estéreo, la línea de base es la distancia entre las dos cámaras del sistema estéreo. Una línea de base más larga facilita la medición de la profundidad de objetos lejanos, mientras que una más corta es más adecuada para primeros planos. La elección de la línea de base afecta tanto el alcance como la precisión de las mediciones de profundidad.
La calibración es esencial para mantener la precisión en los sistemas estereoscópicos. Los métodos de calibración fotogramétrica, como el método de Zhang, utilizan un tablero de ajedrez para estimar los parámetros de la cámara. Este enfoque proporciona una alta precisión y es fácil de usar. Puede mejorar aún más la calibración optimizando la distancia y el ángulo de las imágenes de calibración. Algunos métodos avanzados utilizan objetivos circulares o incluso rastreadores láser para obtener una precisión submilimétrica. En entornos industriales, debe revisar la calibración cada pocos meses. Si su sistema se mueve con frecuencia o se enfrenta a condiciones adversas, la recalibración mensual mantiene alta la precisión de la medición de profundidad.
Consejo: La calibración regular corrige la distorsión de la lente y la desalineación de la cámara, lo cual es crucial para obtener datos de profundidad confiables.
Resolución y Precisión
La resolución del sensor es fundamental para la precisión de los sistemas estéreo. Una resolución más alta permite detectar cambios menores en la posición de los objetos, lo que mejora la precisión del mapeo 3D. Por ejemplo, las cámaras comerciales ahora ofrecen resoluciones de hasta 4K e incluso 8K, lo que proporciona imágenes detalladas para cálculos de profundidad precisos. Al utilizar sensores de alta calidad, se obtienen imágenes más nítidas y una mejor correspondencia de características entre pares estéreo. Esto se traduce en una estimación de profundidad más precisa.
La precisión en los sistemas estéreo depende de varios factores:
- Resolución del sensor
- Distancia de referencia
- Calidad de calibración
- Condiciones de iluminación
También puede usar la fusión de sensores para combinar datos de varios sensores. Este enfoque mejora la precisión de sus mapas 3D, especialmente en entornos grandes o complejos. La fusión de sensores funciona bien con algoritmos avanzados e IA, lo que le ayuda a lograr una profundidad fiable incluso en escenas complejas.
Procesamiento en tiempo real
Los sistemas estéreo modernos ofrecen percepción de profundidad en tiempo real, vital para la robótica y la automatización. Las tecnologías de procesamiento integradas, como las FPGA y los chips de IA, gestionan tareas como la rectificación de imágenes, la correspondencia estéreo y el cálculo de disparidad directamente en la cámara. Por ejemplo, la cámara OAK-D SR utiliza el chip Myriad X de Intel para ejecutar redes neuronales integradas. Esta configuración permite la detección y clasificación de objetos sin hardware adicional.
Puede esperar altas velocidades de fotogramas en sistemas estéreo en tiempo real. La siguiente tabla muestra las velocidades de procesamiento típicas:
| Tamaño de vídeo | Rango de disparidad | Velocidad de fotogramas (fps) | Notas |
|---|---|---|---|
| 1920 × 1080 | 256 | 47.6 | Sistema optimizado FPGA |
| 1024 × 768 | 128 | 129 | Sistema optimizado FPGA |

Las cámaras estéreo generan Nubes de puntos 3D, que puede utilizarse para mapeo y medición. Si bien las nubes de puntos estereoscópicas son menos densas que las de LiDAR, proporcionan información de profundidad útil a un menor costo. La fusión de sensores puede mejorar aún más estos resultados.
La mayoría de las cámaras estéreo industriales son compatibles con estándares como GigE Vision. Esta función garantiza una fácil integración con sus sistemas existentes y una rápida transferencia de datos.
Nota: El procesamiento en tiempo real y los estándares de la industria lo ayudan a implementar la tecnología de cámara estéreo de manera rápida y confiable en sus aplicaciones.
Visión estereoscópica vs. otras imágenes 3D
Visión estéreo vs. ToF
Cuando se compara visión en estéreo En las cámaras de tiempo de vuelo (ToF), se observan algunas diferencias clave. La visión estereoscópica utiliza dos cámaras para estimar la profundidad comparando imágenes desde diferentes puntos de vista. Las cámaras ToF miden el tiempo que tarda la luz en viajar hasta un objeto y regresar, lo que proporciona datos de profundidad directos. Esta diferencia afecta tanto la precisión como el rendimiento.
| Parámetro | visión en estéreo | Tiempo de vuelo (ToF) |
|---|---|---|
| Precisión de profundidad | Generalmente en el rango de centímetros (cm) | Mayor precisión que va desde milímetros hasta centímetros (mm~cm) |
| Principio | Calcula la profundidad comparando las disparidades entre dos imágenes desde diferentes puntos de vista. | Mide el tiempo real que tarda la luz en viajar hacia y desde el objeto, lo que proporciona una medición de profundidad directa. |
| Complejidad del software | Alto (requiere algoritmos complejos de comparación de disparidades) | Baja (datos de profundidad proporcionados directamente por el sensor) |
| Rango de profundidad | Limitada | Análisis escalable |
| Rendimiento con poca luz | Débil | Bueno |
| Tiempo de Respuesta | Media | Rápido |
Descubrirá que la visión estereoscópica funciona mejor en exteriores y en campos de visión amplios. No requiere iluminación especial, por lo que puede usarla en muchos entornos. Las cámaras estereoscópicas son rentables y le ofrecen imágenes en color y... datos 3D Al mismo tiempo. Sin embargo, las cámaras ToF ofrecen mayor precisión de profundidad y funcionan bien en entornos con poca luz. Si necesita mapeo 3D rápido y en tiempo real con alta precisión, las cámaras ToF pueden ser la mejor opción.
Visión estereoscópica vs. LiDAR
Tanto la visión estereoscópica como el LiDAR permiten capturar información 3D, pero utilizan métodos diferentes. Las cámaras estereoscópicas son sensores pasivos. Se basan en la luz natural y la textura de la imagen para estimar la profundidad. Los sistemas LiDAR envían pulsos láser y miden el tiempo que tarda la luz en regresar. Esto proporciona datos de profundidad muy precisos y fiables, incluso a largas distancias.
- Las cámaras de visión estereoscópica ofrecen imágenes en color y percepción 3D a un menor costo. Funcionan bien en distancias cortas y medias.
- El LiDAR proporciona mapas 3D de alta resolución con precisión centimétrica o incluso milimétrica. Ofrece un mejor rendimiento para la detección a larga distancia y en entornos complejos.
- Las cámaras estéreo pueden tener dificultades a medida que aumenta la distancia, mientras que el LiDAR mantiene un rendimiento sólido en rangos mayores.
| Ecológica | Costo de hardware |
|---|---|
| visión en estéreo | Bajo (por ejemplo, $349-$5,000 dependiendo del modelo) |
| LiDAR | Caro (significativamente más alto que la visión estereoscópica) |
Si necesita datos espaciales 3D detallados para tareas como la gestión del tráfico o el monitoreo de multitudes, el LiDAR suele ser la mejor opción. Para proyectos con presupuestos ajustados que requieren una buena percepción de profundidad, la visión estereoscópica ofrece una solución práctica.
Fortalezas y Limitaciones
La visión estereoscópica destaca por su flexibilidad y adaptabilidad ambiental. Puede usar cámaras estereoscópicas en exteriores, con luz solar intensa o condiciones climáticas cambiantes. Muchos modelos cuentan con carcasas y filtros robustos que ayudan a reducir el deslumbramiento y mejorar la estimación de profundidad. También puede combinar la visión estereoscópica con otros sensores, como unidades intraluminales (IMU) o cámaras térmicas, para aumentar la fiabilidad de la percepción.
Consejo: La visión estereoscópica es ideal para robótica, vehículos autónomos, agricultura y manufactura. Proporciona datos 3D en tiempo real y una sólida percepción de profundidad en diversos escenarios.
Sin embargo, la visión estereoscópica tiene algunas limitaciones. Presenta dificultades en entornos con poca luz o poca textura, como paredes lisas o superficies brillantes. En estos casos, el sistema podría no encontrar suficientes características para la correspondencia entre imágenes, lo que genera lagunas en el mapa 3D. Las escenas de alto rango dinámico también pueden causar problemas, dificultando la obtención de datos de profundidad precisos. Si bien los sistemas estereoscópicos activos pueden añadir textura con patrones proyectados, esto aumenta el coste y la complejidad.
La visión estereoscópica es una de las tecnologías de percepción de profundidad más populares. Ofrece un equilibrio entre costo, percepción 3D y flexibilidad. Debe considerar sus necesidades de profundidad, precisión y condiciones ambientales al elegir entre estereoscópica, ToF o LiDAR para su proyecto de visión artificial.
Aplicaciones

Automatización Industrial
Las cámaras estereoscópicas se utilizan ampliamente en la automatización industrial. Estos sistemas ayudan a las máquinas a medir distancias y reconocer objetos en las líneas de montaje. Con la percepción de profundidad, se pueden guiar brazos robóticos para recoger y colocar piezas con alta precisión. Las cámaras estereoscópicas facilitan el control de calidad, comprobando si los artículos encajan entre sí o si los productos cumplen los requisitos de tamaño. También se utilizan para la medición de volumen y la selección de contenedores, donde los robots necesitan encontrar y recoger artículos de una pila. En aplicaciones de alta precisión, las cámaras estereoscópicas proporcionan una detección de profundidad fiable, incluso en entornos de rápido movimiento. Esta tecnología ayuda a las fábricas a funcionar de forma fluida y segura.
Robótica y Drones
Las cámaras estereoscópicas desempeñan un papel fundamental en la robótica y la navegación de drones. Se utilizan para:
- Navegación autónoma y planificación de trayectoria, gracias a la percepción de profundidad en tiempo real.
- Evitación de obstáculos en lugares dinámicos como almacenes.
- Tareas de selección y colocación que requieren una detección precisa de objetos 3D.
- Integración con IA para una detección de profundidad más inteligente en escenas complejas.
- Monitoreo de cultivos y automatización agrícola con drones.
- SLAM (Localización y Mapeo Simultáneos) para mapear y moverse sin GPS.
Las cámaras estereoscópicas capturan información visual y de profundidad, lo que permite que los robots y drones detecten y reaccionen rápidamente ante obstáculos. El procesamiento integrado en algunas cámaras reduce el retraso, lo cual es importante para una toma de decisiones rápida. Se beneficia de cámaras pequeñas y ligeras que consumen poca energía, pero que aun así proporcionan datos de alta calidad para un movimiento seguro.
ADAS y Medicina
En los Sistemas Avanzados de Asistencia al Conductor (ADAS), las cámaras estéreo ayudan a los vehículos a ver la carretera en 3D. La percepción de profundidad se obtiene mediante la triangulación de imágenes de dos cámaras, de forma similar a la visión humana. Esto permite a los coches detectar objetos, calcular distancias y reconocer los límites de carril. Las cámaras estéreo son compatibles con funciones como el Frenado Automático de Emergencia y el Asistente de Mantenimiento de Carril. Funcionan bien en condiciones difíciles, como de noche o con niebla, y ofrecen una alternativa económica al LiDAR para la detección de profundidad.
En el campo de la imagenología médica, las cámaras estereoscópicas mejoran la navegación quirúrgica y la visualización 3D. Se encuentran en los sistemas quirúrgicos de realidad aumentada (RA), donde rastrean las características anatómicas y superponen imágenes 3D al paciente. Esto proporciona a los cirujanos una percepción de profundidad en tiempo real y les ayuda a realizar procedimientos más seguros y precisos. Las cámaras estereoscópicas también se utilizan en endoscopios y microscopios estereoscópicos, facilitando y agilizando las cirugías complejas.
Consejo: Las cámaras estéreo le brindan una herramienta poderosa para la detección de profundidad y el mapeo 3D en muchos campos, desde fábricas hasta hospitales.
Las cámaras estéreo le brindan una visión 3D precisa y una fuerte percepción de profundidad para muchas tareas de visión artificialDisfruta de altas velocidades de fotogramas, un amplio campo de visión y un rendimiento robusto en entornos difíciles. Sin embargo, debes estar atento a desafíos como cambios de iluminación, desviaciones de calibración y mayores necesidades computacionales.
- Nos apasiona elegir un sistema, tenga en cuenta factores como la sincronización, la resolución, la línea base, el tipo de lente y la rigidez de la carcasa.
- La calibración y la rectificación de imágenes siguen siendo fundamentales para obtener resultados confiables.
Para obtener más orientación, consulte los artículos de la industria de Teledyne Vision Solutions y UnitX Los laboratorios ofrecen consejos prácticos sobre hardware, software y estrategias de implementación.
Preguntas Frecuentes
¿Cuál es la principal ventaja de utilizar cámaras estéreo en visión artificial?
Las cámaras estéreo te brindan visión 3D realPuedes medir la profundidad y la distancia. Esto ayuda a las máquinas a comprender su entorno y a tomar mejores decisiones.
¿Cómo mantener la precisión de las cámaras estéreo a lo largo del tiempo?
Debe calibrar sus cámaras estereoscópicas regularmente. La calibración corrige la distorsión de la lente y la desalineación de la cámara. Esto mantiene la fiabilidad de sus mediciones de profundidad.
¿Pueden las cámaras estéreo funcionar en condiciones de poca luz?
Las cámaras estéreo necesitan suficiente luz para captar los detalles. Con poca luz, es posible que la profundidad no sea buena. Puedes usar sistemas estéreo activos con iluminación adicional para facilitar la captura.
¿Qué datos proporcionan las cámaras estéreo?
Las cámaras estéreo le brindan imágenes en color y mapas de profundidadPuede utilizar estos datos para la detección, medición y navegación de objetos.
Vea también
Comprender el uso de cámaras en la visión artificial
Perspectivas esenciales sobre las tecnologías de visión artificial y computacional
Guía para principiantes sobre metrología en sistemas de visión artificial
Fundamentos de la resolución de la cámara en sistemas de visión artificial
La importancia de los escáneres 3D en los sistemas de visión artificial