
Un sistema de propuesta de regiones en visión artificial identifica las áreas de una imagen que probablemente contengan un objeto. Este paso ayuda a los modelos de detección de objetos a centrarse en ubicaciones prometedoras, lo que mejora la velocidad y la precisión. El sistema de visión artificial de propuesta de regiones selecciona un pequeño conjunto de regiones candidatas en lugar de examinar cada punto posible. Con este enfoque, la detección se vuelve más rápida y fiable. Por ejemplo, imagine a un bibliotecario que busca un libro específico consultando únicamente los estantes etiquetados en lugar de cada página. El siguiente gráfico muestra que, con 100 propuestas, el sistema alcanza una tasa de recuperación del 92.8 % con un IoU de 0.5, casi igualando la precisión de los modelos que utilizan 1,000 propuestas. Esta eficiencia se traduce en una menor cantidad de comprobaciones que permiten una detección de objetos de alta calidad.

Puntos clave
- Los sistemas de propuestas de regiones ayudan modelos de detección de objetos Encuentre rápidamente áreas donde puedan encontrarse objetos, mejorando tanto la velocidad como la precisión.
- Los cuadros de anclaje y la intersección sobre unión (IoU) trabajan juntos para identificar y refinar regiones candidatas para una mejor localización de objetos.
- Los avances en el aprendizaje profundo, como las redes de propuestas de regiones (RPN), hacen que las propuestas de regiones sean más rápidas y precisas que los métodos tradicionales.
- Las propuestas de regiones eficientes reducen los costos computacionales, lo que permite detección de objetos en tiempo real en aplicaciones como coches autónomos y cámaras de seguridad.
- Técnicas como la agrupación de ROI y la regresión del cuadro delimitador mejoran aún más la precisión de la detección y al mismo tiempo mantienen la eficiencia del procesamiento.
Propuesta de Región Sistema de Visión Artificial
¿Qué es una propuesta de región?
Una propuesta de región es un área candidata en una imagen que probablemente contenga un objeto. El sistema de visión artificial de propuesta de región utiliza estas regiones candidatas para centrarse en las partes prometedoras de la imagen. Este enfoque reduce la necesidad de buscar en cada píxel o ubicación. En su lugar, el sistema selecciona un conjunto más pequeño de regiones con alta probabilidad de contener objetos.
El proceso técnico detrás de un sistema de visión artificial para una propuesta de región implica varios pasos:
- El sistema utiliza una red completamente convolucional para analizar mapas de características de una red neuronal convolucional base.
- Coloca cuadros de anclaje de diferentes tamaños y formas en cada punto del mapa de características. Estos cuadros actúan como ventanas deslizantes que escanean en busca de posibles objetos.
- Para cada cuadro de anclaje, la red predice si contiene un objeto (primer plano) o no (fondo). También ajusta el cuadro para que se ajuste mejor al objeto.
- El sistema utiliza una métrica llamada Intersección sobre Unión (IoU) para determinar si un cuadro de anclaje coincide con un objeto real. Si la IoU supera un umbral determinado, el cuadro se etiqueta como primer plano.
- La red combina dos tipos de pérdida: una para clasificar las cajas como objeto o fondo y otra para refinar las coordenadas de las cajas.
- El resultado final es un conjunto de cuadros refinados, llamados propuestas de región, que luego pasan a la siguiente etapa para la detección detallada de objetos.
Los algoritmos de propuesta de regiones, como la Búsqueda Selectiva, los Cuadros de Borde y las Redes de Propuesta de Regiones (RPN), ayudan al sistema de visión artificial de propuesta de regiones a generar un número manejable de regiones candidatas. Este proceso agiliza y aumenta la precisión de la detección.
Por qué son importantes las propuestas regionales
Las propuestas de región desempeñan un papel fundamental en el sistema de visión artificial de propuestas de región. Ayudan al sistema a centrarse en las áreas con mayor probabilidad de contener objetos, lo que mejora la velocidad y la precisión. Al limitar el espacio de búsqueda, el sistema evita perder tiempo en partes vacías o irrelevantes de la imagen.
Las investigaciones demuestran que el preentrenamiento del módulo de red de propuesta de región reduce los errores de localización en detectores multietapa. Este entrenamiento específico mejora el rendimiento, especialmente cuando los datos etiquetados son limitados. La inclusión de la red de propuesta de región en el preentrenamiento mejora la precisión en la localización de objetos, lo que optimiza los resultados generales de detección.
El impacto de las propuestas regionales se puede ver de varias maneras:
- Las redes de propuestas de regiones son esenciales en modelos como Mask R-CNN, que necesitan una localización precisa de objetos.
- Los modelos más recientes muestran mejoras mensurables en la precisión. Por ejemplo, DI-MaskDINO logra una mayor precisión promedio tanto para cuadros delimitadores como para máscaras en conjuntos de datos populares.
- Frustum Voxnet V2 mejora la precisión de detección en un 11% en imágenes RGBD en comparación con versiones anteriores.
- Los conjuntos de datos de referencia como MS COCO y Cityscapes informan puntajes de Intersección sobre Unión (IoU) más altos cuando se utilizan mecanismos de propuesta de región.
- Métricas como la precisión promedio (AP) y la calidad panóptica (PQ) muestran que los modelos que utilizan propuestas de regiones superan a los sistemas tradicionales de detección de objetos.
| Modelo | Precisión (mAP) | Velocidad (FPS) | Notas |
|---|---|---|---|
| R-CNN más rápido | Mayor | 1 | Máxima precisión con 300 propuestas de regiones. |
| SSD en MobileNet | mAP más alto | Gestión del riesgo | Optimizado para procesamiento en tiempo real. |
| R-FCN | Buen balance | N/A | Equilibra la precisión y la velocidad de manera efectiva. |
| R-CNN más rápido | Habitaciones | N/A | Funciona bien incluso con 50 propuestas. |
| Modelo de conjunto | 41.3% | N/A | Mejor entrada en el desafío COCO 2016. |
Esta tabla muestra que detectores de dos etapas Como Faster R-CNN, que utiliza un sistema de visión artificial de propuesta de regiones, alcanza la máxima precisión. Estos sistemas procesan menos propuestas, pero aun así encuentran objetos con rapidez y precisión.
Las propuestas de regiones también reducen la complejidad computacional. Al centrarse únicamente en regiones prometedoras, el sistema puede realizar la detección de objetos en tiempo real. Este enfoque específico aumenta la precisión de la detección y reduce los falsos positivos. Las evaluaciones de rendimiento en conjuntos de datos como PASCAL VOC e ILSVRC muestran que los modelos con propuestas de regiones, como Fast R-CNN y Faster R-CNN, mejorar tanto la velocidad como la precisiónEstas mejoras resaltan la importancia de las propuestas de regiones en la detección de objetos modernos.
Desafíos de detección de objetos
Limitaciones de la búsqueda exhaustiva
Los métodos de búsqueda exhaustiva prueban todas las opciones posibles para encontrar objetos en una imagen. Este enfoque funciona en casos simples, pero rápidamente se convierte en un problema a medida que las imágenes se vuelven más complejas. El número de regiones posibles crece rápidamente cuando el sistema busca muchas características. Esto hace que la búsqueda exhaustiva sea lenta y difícil de usar para la detección de objetos en el mundo real.
| Aspecto de la evidencia | Explicación |
|---|---|
| Espacio de búsqueda exponencial | Los métodos exhaustivos como la búsqueda en cuadrícula se vuelven poco prácticos a medida que aumenta el número de hiperparámetros, lo que genera espacios de búsqueda muy grandes. |
| Costo computacional | Se requieren altos recursos computacionales, lo que hace que la búsqueda exhaustiva sea ineficiente para modelos complejos y datos de alta dimensión. |
| Metodos alternativos | La búsqueda aleatoria y la optimización bayesiana ofrecen enfoques de ajuste más eficientes y que aprovechan los recursos. |
| Restricciones de implementación | Los métodos que ahorran recursos permiten realizar ajustes en dispositivos con potencia de procesamiento limitada, como teléfonos móviles o auriculares virtuales. |
La búsqueda en cuadrícula, un método exhaustivo común, verifica cada combinación de ajustes. Funciona con modelos pequeños, pero resulta demasiado lento para los algoritmos modernos de detección de objetos. Búsqueda aleatoria Se pueden encontrar buenas soluciones más rápido seleccionando configuraciones aleatoriamente. Los estudios demuestran que la búsqueda aleatoria suele igualar o incluso superar a la búsqueda en cuadrícula en menos tiempo. Por ello, la mayoría de los sistemas de detección de objetos utilizan métodos de búsqueda más inteligentes para ahorrar tiempo y energía.
Necesidad de una localización eficiente
Una localización eficiente ayuda a los sistemas de detección de objetos a encontrarlos con rapidez y precisión. Muchas tareas del mundo real, como los vehículos autónomos, las cámaras de seguridad y la búsqueda de imágenes, dependen de una detección rápida y precisa de objetos. Los primeros algoritmos de detección de objetos utilizaban ventanas deslizantes, que examinaban cada parte de la imagen. Este método era lento y consumía mucha potencia informática.
- Una localización eficiente es importante para la seguridad y la usabilidad en aplicaciones del mundo real.
- Los detectores de ventanas corredizas son lentos y necesitan mejores soluciones.
- CNN basadas en regiones mejorar la precisión pero aún así utilizar muchos recursos.
- Los detectores de disparo único como SSD y YOLO funcionan más rápido pero pueden perder algo de precisión.
- Métricas como precisión, recuperación, precisión promedio (mAP) y cuadros por segundo (FPS) muestran la necesidad de equilibrar velocidad y precisión.
- Los mejores detectores ahora alcanzan entre 20 y 30 FPS en imágenes de alta resolución, lo que demuestra la demanda de una localización eficiente.
Un nuevo método de detección de objetos 3D con cámaras RGBD puede procesar cada fotograma en tan solo 20 milisegundos. Encuentra la posición de los objetos con gran precisión, incluso con recursos informáticos limitados. Esto demuestra que una localización eficiente no solo es útil, sino también necesaria para los sistemas modernos de detección de objetos.
Evolución de la propuesta de la región

Métodos tradicionales
Los primeros algoritmos de propuesta de regiones utilizaban características personalizadas y reglas sencillas para encontrar objetos en imágenes. Estos métodos solían basarse en ventanas deslizantes o búsqueda selectiva. La búsqueda selectiva agrupaba píxeles similares para sugerir posibles ubicaciones de objetos. El proceso era lento porque la CNN debía procesar cada región por separado. Los investigadores mejoraron la eficiencia desarrollando nuevos marcos y combinando diferentes técnicas.
Algunos enfoques tradicionales importantes incluyen:
- R-CNN y búsqueda selectiva: La CNN procesó cada propuesta de región una por una, lo que llevó mucho tiempo.
- Red SPP: Este método procesó la imagen con una red neuronal convolucional solo una vez, pero el entrenamiento aún era complejo.
- R-CNN rápido: Este enfoque utilizó la agrupación de RoI para acelerar la detección, pero aún dependía de una búsqueda selectiva de propuestas.
Muchos estudios se basaron en estas ideas. Por ejemplo, Yang et al. utilizaron Fast R-CNN para la identificación de barcos. Yao et al. combinaron redes neuronales profundas con redes de propuesta de región para detectar barcos. Chae et al. diseñaron un método de detección rápida basado en ResNet. Otros investigadores mejoraron la detección mediante el uso de redes totalmente convolucionales, mejores métodos de cuadro delimitador y nuevas formas de combinar características.
Estos algoritmos tradicionales de propuesta de regiones sentaron las bases para la detección moderna de objetos. Demostraron que centrarse en regiones prometedoras podía mejorar tanto la velocidad como la precisión.
Avances en el aprendizaje profundo
El aprendizaje profundo transformó el funcionamiento de los algoritmos de propuesta de regiones. Los modelos CNN modernos ahora aprenden a generar propuestas directamente a partir de los datos. La R-CNN, más rápida, introdujo la red de propuesta de regiones, que genera propuestas con mayor rapidez y alta precisión. Las redes de pirámides de características mejoraron la detección de objetos pequeños mediante el uso de mapas de características multiescala.
La siguiente tabla muestra cómo los modelos de aprendizaje profundo han mejorado el rendimiento de las propuestas de región:
| Modelo / Métrica | Mejora / Resultado |
|---|---|
| YOLOv10 | Aumento del 1.4 % en la precisión media; reducción de la latencia del 46 % |
| YOLOv5 (mejorado) | mAP aumentó de 0.349 a 0.622; precisión 0.865 |
| YOLO-MECD | +3.9 mAP; +0.2 precisión; +4.1 recuperación; 75.6 % menos parámetros; modelo 74.4 % más pequeño |
| R-CNN más rápido (RPN) | Precisión de última generación pero FPS más bajos que los detectores de una etapa |
| Regresión de cuadro delimitador | Los métodos sin ancla y la optimización reducen los errores |
| Métricas de IoU | Los umbrales adaptativos mejoran la calidad de la detección |
El aprendizaje profundo ha mejorado la precisión y eficiencia de los algoritmos de propuesta de regiones. Por ejemplo, los modelos YOLO ahora alcanzan mayor precisión y recuperación, con un menor consumo de memoria y una mayor velocidad de ejecución. Los detectores de dos etapas, como Faster R-CNN, siguen ofreciendo la máxima precisión, pero los detectores de una etapa, como YOLO y SSD, ofrecen resultados más rápidos al omitir propuestas explícitas. Las mejoras en la regresión de cuadro delimitador y las métricas de IoU ayudan a reducir errores y a mejorar la calidad de la detección. Estos avances permiten que los sistemas basados en CNN gestionen tareas del mundo real con mayor velocidad y fiabilidad.
Red de Propuestas Regionales (RPN)

Cómo funcionan las RPN
A red de propuesta de región Ayuda a una CNN a encontrar objetos en imágenes con rapidez y precisión. La red de propuesta de regiones utiliza un diseño totalmente convolucional. Comparte características con la red de detección principal. Esta compartición agiliza y optimiza el proceso.
El proceso comienza cuando la CNN crea un mapa de características a partir de la imagen de entrada. Una pequeña ventana deslizante recorre este mapa. En cada punto, la red de propuesta de región genera varios cuadros de anclaje de diferentes tamaños y formas. Estos cuadros de anclaje actúan como redes, listas para capturar objetos de diversos tipos.
Para cada cuadro de anclaje, la red predice si contiene un objeto o solo el fondo. También ajusta el cuadro para que se ajuste mejor al objeto. La red de propuesta de región utiliza una función de pérdida combinada. Esta función ayuda a la red a aprender a clasificar los cuadros y a refinar sus posiciones simultáneamente.
El resultado es un conjunto de propuestas de región. Estas propuestas pasan a la siguiente etapa para una detección de objetos más detallada. La red de propuestas de región puede generar aproximadamente 300 propuestas por imagen con muy poco cálculo adicional. Este diseño permite la detección de objetos en tiempo real con alta precisión.
Los resultados experimentales muestran que una red ternaria jerárquica de propuesta de regiones mejora la detección de objetos nuevos y sin etiquetar. Este método funciona bien incluso con pocos datos de entrenamiento. Las pruebas con los conjuntos de datos COCO y PASCAL VOC muestran que esta red mejorada de propuesta de regiones supera a los métodos anteriores, especialmente en la detección de objetos de pocos disparos.
Los pasos a continuación resumen cómo funcionan las redes de propuestas de regiones:
- La CNN procesa la imagen para crear un mapa de características.
- Una ventana deslizante se mueve sobre el mapa de características.
- En cada ubicación, la red genera cuadros de anclaje de diferentes tamaños y formas.
- Cada cuadro de anclaje obtiene una puntuación por su objetividad y una posición refinada.
- La red utiliza una pérdida combinada para entrenar tanto la clasificación como el ajuste de caja.
- Las propuestas finales pasan a la red de detección para su posterior análisis.
Cajas de anclaje y pagarés
Los cuadros de anclaje son un componente clave de la red de propuestas de regiones. Ayudan a la CNN a determinar la ubicación de los objetos, incluso antes de saber qué son. Cada cuadro de anclaje tiene un tamaño y una forma definidos. La red coloca varios cuadros de anclaje en cada punto del mapa de características. De esta manera, puede encontrar objetos de diferentes tamaños y formas.
La red de propuestas de región utiliza una métrica llamada Intersección sobre Unión (IoU) para medir la coincidencia de un cuadro de anclaje con un objeto real. IoU compara la superposición entre el cuadro de anclaje y el cuadro de referencia. Un IoU más alto significa una mejor coincidencia. La red utiliza IoU para decidir qué cuadros de anclaje son lo suficientemente adecuados para convertirse en propuestas de región.
Estudios empíricos demuestran que la cantidad, el tamaño y la forma de los cuadros de anclaje afectan la precisión de la detección. Un mayor número de cuadros de anclaje suele resultar en valores de IoU medios más altos. Cuando el IoU medio supera 0.5, la red se alinea bien con los objetos reales. Los investigadores suelen utilizar algoritmos de agrupamiento, como k-medoides, para optimizar el tamaño de los cuadros de anclaje para los datos de entrenamiento.
Las pruebas comparativas realizadas con el conjunto de datos SeaDronesSee revelan que la optimización de los cuadros de anclaje por sí sola no siempre mejora la detección. Los mejores resultados se obtienen cuando los cuadros de anclaje se combinan con redes de pirámides de características. Esta combinación ayuda a la red de propuesta de regiones a detectar objetos a diferentes escalas. La optimización de los cuadros de anclaje por capas para cada nivel de la pirámide de características mejora aún más la precisión.
Durante el entrenamiento, es importante establecer el umbral de IoU correcto. Un umbral bajo puede aceptar coincidencias deficientes, lo que reduce la precisión. Un umbral alto puede pasar por alto objetos reales, lo que reduce la recuperación. La red de propuesta de región debe equilibrar estos ajustes para obtener los mejores resultados.
Una analogía sencilla ayuda a explicar las cajas de anclaje y el IoU. Imaginemos a un pescador usando redes de diferentes tamaños para pescar en un estanque. Algunas redes son aptas para peces pequeños, mientras que otras son aptas para peces grandes. El pescador comprueba qué parte de cada red cubre al pez. Las mejores redes son las que cubren mejor al pez. De igual manera, la red de propuesta de región usa cajas de anclaje e IoU para encontrar las mejores coincidencias con los objetos de una imagen.
Regresión de cuadro delimitador
La regresión de cuadro delimitador es una técnica que ayuda a la red de propuesta de regiones a ajustar los cuadros de anclaje para que se ajusten mejor a los objetos. La red predice pequeños cambios en la posición y el tamaño de cada cuadro de anclaje. Estos cambios ayudan a que el cuadro se ajuste al objeto lo más posible.
La red de propuesta de región aprende a realizar estos ajustes durante el entrenamiento. Utiliza una función de pérdida que mide la proximidad del cuadro predicho al objeto real. Una mejor regresión del cuadro delimitador se traduce en una mayor precisión de detección.
Estudios experimentales demuestran que las mejoras en la regresión de cuadro delimitador mejoran el rendimiento en muchos conjuntos de datos. Por ejemplo, la introducción de la función de pérdida AIoU en YOLOv4 mejoró la precisión de la regresión de cuadro delimitador. Esto resultó en una mayor Precisión Media Promedio (mAP) en los conjuntos de datos PASCAL VOC y Microsoft COCO.
| Conjunto de datos | de Injusticias | Mejora en mAP (%) | Contribución clave |
|---|---|---|---|
| VOC PASCAL | YOLOv4 | +0.61 | La pérdida de AIoU mejora la precisión de la regresión del cuadro delimitador |
| Microsoft COCO | YOLOv4 | +1.98 | La pérdida de AIoU mejora la convergencia y se centra en objetos difíciles |
Otros modelos, como Enhanced YOLOv8 y Faster-RCNN, también muestran grandes ganancias en precisión y mAP cuando se utilizan funciones de pérdida de regresión de cuadro delimitador optimizadas.
| Modelo | Precisión (%) | Mejora de mAP con respecto al valor inicial (%) | Notas |
|---|---|---|---|
| YOLOv8 mejorado | 98.35 | +3.93 (precisión) | Utiliza mecanismos de atención y pérdida de regresión del cuadro delimitador optimizados por Shape-IoU |
| YOLOv7 | N/A | +4.48 | Comparación de la línea de base |
| YOLOv5 | N/A | +6.66 | Comparación de la línea de base |
| Más rápido-RCNN | N/A | +13.63 | Comparación de la línea de base |
| CornerNet | N/A | +13.20 | Comparación de la línea de base |
| SSD | N/A | +9.84 | Comparación de la línea de base |

La regresión de cuadro delimitador ayuda a la red de propuesta de regiones a ajustar sus estimaciones. Este paso aumenta la precisión de la detección final del objeto. La combinación de cuadros de anclaje, IoU y regresión de cuadro delimitador permite a la red de propuesta de regiones ofrecer resultados rápidos y precisos en los sistemas de visión artificial modernos.
Eficiencia y Precisión
Detección de objetos más rápida
Los sistemas de propuesta de regiones aceleran considerablemente el funcionamiento de los modelos de detección de objetos. Reemplazan métodos lentos como la búsqueda selectiva con Redes de Propuesta de Regiones (RPN). Las RPN utilizan una red completamente convolucional para escanear mapas de características y crear regiones de interés candidatas. Este proceso comparte características con la red de detección, lo que reduce el trabajo adicional. Los cuadros de anclaje a diferentes escalas y formas ayudan al sistema a encontrar objetos de diversos tamaños. La red utiliza Intersección sobre Unión (IoU) para centrarse en las regiones de interés más importantes. Un regresor de cuadro delimitador ajusta estas propuestas para una mayor precisión. Estos pasos posibilitan la detección de objetos en tiempo real y pueden reducir el tiempo de ejecución hasta diez veces en comparación con métodos anteriores.
- Las RPN generan regiones de interés rápidamente.
- Los mapas de características compartidas reducen los costos computacionales.
- IoU y regresión de cuadro delimitador mejorar la precisión.
Faster R-CNN combina RPN y Fast R-CNN en una sola red. Este diseño permite entrenamiento de extremo a extremo y... aumenta la eficiencia y precisión. El sistema asigna a cada región de interés una puntuación de objetividad, lo que ayuda a filtrar las áreas vacías.
Agrupación de ROI
La agrupación de ROI desempeña un papel fundamental en la mejora de la velocidad y la precisión. Extrae características de tamaño fijo de las regiones de interés, incluso si estas tienen formas diferentes. Este método permite a la red reutilizar mapas de características convolucionales, lo que ahorra tiempo tanto durante el entrenamiento como durante las pruebas. La agrupación de ROI divide cada región de interés en secciones iguales y aplica la agrupación máxima. El resultado es una salida de tamaño fijo compatible con cualquier tamaño de entrada.
La agrupación de ROI facilita el entrenamiento integral y permite que el sistema procese varias regiones de interés simultáneamente. Este enfoque reduce la sobrecarga y agiliza el procesamiento de propuestas de regiones.
Ross Girshick introdujo por primera vez la agrupación de ROI en Fast R-CNN. Hoy en día, sigue siendo un estándar en los procesos de detección de objetos.
Aplicaciones del mundo real
Los sistemas de propuesta de regiones impulsan numerosas aplicaciones del mundo real. Los vehículos autónomos los utilizan para detectar peatones y otros vehículos rápidamente. Las cámaras de seguridad se basan en estos sistemas para la detección de objetos en tiempo real en lugares concurridos. Las herramientas de imagenología médica utilizan regiones de interés para detectar tumores u otras características con alta precisión. Las tiendas minoristas utilizan la detección de objetos para rastrear productos en los estantes. Los drones utilizan estos sistemas para detectar objetos en misiones de búsqueda y rescate.
- Los coches autónomos necesitan una detección rápida y precisa.
- La seguridad y la vigilancia dependen de la detección de objetos en tiempo real.
- Las imágenes médicas utilizan regiones de interés para obtener resultados precisos.
Estos ejemplos muestran cómo los sistemas de propuesta de regiones mejoran tanto la eficiencia como la precisión en la vida diaria.
Los sistemas de propuesta de regiones desempeñan un papel fundamental en la visión artificial moderna. Ayudan a los modelos a encontrar objetos con rapidez y precisión. Estos sistemas resuelven los principales desafíos de la detección de objetos al agilizar y aumentar la precisión de las búsquedas. La investigación en curso explora nuevas formas de evaluar y mejorar estos sistemas:
- Grupos globales promueven una evaluación de la investigación responsable e inclusiva.
- Países como China y Japón están adoptando una perspectiva de evaluación cualitativa.
- Las nuevas tendencias incluyen la ciencia abierta, la inteligencia artificial y un mejor equilibrio entre la revisión por pares y las métricas.
Estos avances dan forma al futuro de la visión artificial e impactan muchas aplicaciones del mundo real.
Preguntas Frecuentes
¿Cuál es el propósito principal de un sistema de propuestas de regiones?
A sistema de propuestas de regiones Ayuda a un modelo de visión artificial a encontrar áreas en una imagen que puedan contener objetos. Este paso agiliza y aumenta la precisión de la detección de objetos.
¿Cómo mejoran los cuadros de anclaje la detección de objetos?
Cajas de anclaje Permite que el modelo busque objetos de diferentes tamaños y formas. El sistema coloca estos cuadros en varios puntos de la imagen. Este método ayuda al modelo a encontrar más objetos.
¿Por qué es importante la intersección sobre la unión (IoU)?
El IoU mide el grado de superposición de una caja predicha con el objeto real. Un IoU más alto significa una mejor coincidencia. El modelo utiliza esta puntuación para determinar qué cajas son suficientemente buenas.
¿Dónde se utilizan en la vida real los sistemas de propuestas de regiones?
Muchas industrias utilizan sistemas de propuesta de región. Los vehículos autónomos, las cámaras de seguridad y las herramientas de diagnóstico por imágenes dependen de estos sistemas para una detección de objetos rápida y precisa.