Introducing G2.ai, the future of software buying.Try now

Sustracción de fondo

por Sagar Joshi
La sustracción de fondo es una técnica que los profesionales utilizan en visión por computadora para rastrear objetos en movimiento en tiempo real. Aprende más sobre el proceso.

¿Qué es la sustracción de fondo?

La sustracción de fondo es una técnica ampliamente utilizada en el procesamiento de video y la visión por computadora para detectar objetos en movimiento. Un algoritmo compara los objetos en movimiento en el video con una imagen de primer plano y una de fondo.

Ayuda en situaciones que implican el seguimiento e identificación de objetos como el monitoreo de tráfico y la vigilancia. Las producciones de cine y televisión también utilizan la sustracción de fondo para crear escenarios virtuales.

Muchos investigadores utilizan software de análisis estadístico para analizar la sustracción de fondo y realizar investigaciones de identificación de espectro.

Aplicaciones de la sustracción de fondo

La sustracción de fondo es una técnica fundamental utilizada en la visión por computadora. Sus usos y aplicaciones están ampliamente extendidos en varios dominios. A continuación se presentan algunas aplicaciones significativas donde la sustracción de fondo juega un papel muy crucial.

  • Vigilancia por video los sistemas dependen en gran medida de la sustracción de fondo para detectar y rastrear objetos en un entorno monitoreado. Eliminar el fondo estático permite que estos sistemas inicien alarmas o acciones cuando se detecta una discrepancia.
  • Seguimiento de objetos mantiene una vigilancia sobre los vehículos en las carreteras y monitorea a los animales en los santuarios.
  • Reconocimiento de gestos ayuda a aislar gestos o movimientos realizados por objetos o individuos del ruido de fondo. Es esencial para controlar dispositivos, entornos de realidad virtual (VR) y juegos con gestos.
  • Aplicaciones de realidad aumentada (AR) superponen información u objetos digitales sobre imágenes simples capturadas con una cámara. La sustracción de fondo diferencia entre escenas del mundo real y elementos virtuales para crear experiencias AR fluidas.
  • Imágenes médicas aíslan regiones o estructuras específicas de interés en imágenes relacionadas con la medicina. Los profesionales utilizan la sustracción de fondo para mejorar las imágenes y segmentar objetos.

Proceso de sustracción de fondo

La sustracción de fondo funciona con un fondo estático a través de los siguientes pasos:

Proceso de Sustracción de Fondo

  • Modelado de fondo: Crear un modelo del fondo representará la parte estática de la escena del video sin objetos en movimiento. Comprende una sola imagen, permitiendo un modelo más detallado con variaciones de iluminación, sombras o reflejos.
  • Detección de primer plano: El video compara cada nuevo cuadro con el modelo de fondo. Los cuadros o partes de la estructura que muestren diferencias significativas con el fondo se considerarán el primer plano.
  • Umbralización y actualización: La umbralización detecta la diferencia entre el cuadro actual y el modelo de fondo. Compara píxeles de los objetos de fondo y primer plano. Los profesionales pueden actualizar este modelo según las necesidades y requisitos para coincidir con los cambios realizados en las escenas.
  • Mejorar la precisión: Los profesionales aplican pasos de procesamiento adicionales como reducción de ruido, erosión y dilatación para mejorar la precisión de los objetos detectados.
  • Seguimiento y análisis de objetos: Los profesionales analizan objetos en movimiento a través de cuadros para clasificarlos, contarlos o analizar su comportamiento.

Técnicas y algoritmos de sustracción de fondo

Se han desarrollado diferentes técnicas y algoritmos para abordar varios escenarios y desafíos cuando se trata de sustracción de fondo. Desde métodos simples adecuados para escenas estáticas hasta algoritmos avanzados requeridos para entornos dinámicos, hay una variedad de técnicas disponibles.

  • Sustracción de fondo estática: Existen dos formas de sustracción de fondo estática, la sustracción básica y la diferenciación de cuadros. La sustracción básica, que es más adecuada para escenas estáticas, implica eliminar un solo cuadro de referencia del cuadro actual para detectar objetos en movimiento. La diferenciación de cuadros calcula la diferencia en los valores de píxeles entre cuadros consecutivos, detectando cambios repentinos así como variaciones en el ruido y las condiciones de iluminación.
  • Sustracción de fondo adaptativa: Esto comprende dos métodos, el Método de Promedio Móvil y la Mezcla de Gaussianas. El Método de Promedio Móvil es útil en situaciones donde es probable que el fondo cambie con frecuencia. Ayuda a mantener un modelo de fondo adaptativo actualizándolo en función del cuadro actual. El Modelo de Mezcla de Gaussianas (GMM) es un método mejorado de sustracción de fondo adaptativa que modela la distribución de píxeles como una mezcla de Gaussianas. Esto lo hace más adecuado para manejar cambios complejos y significativos en las condiciones de iluminación. Es importante señalar que Gaussiana es una función matemática en su forma básica.
  • Algoritmos avanzados. Existen múltiples algoritmos avanzados como las Redes Neuronales Convolucionales (CNN) que pueden mejorar el proceso de aprendizaje profundo en la sustracción de fondo. Estos modelos basados en CNN son capaces de aprender características intrincadas de los cuadros de entrada, lo que los hace competentes para abordar desafíos complejos como sombras, reflejos y fondos dinámicos. Las Redes Neuronales Recurrentes (RNN) pueden capturar dependencias a corto plazo en secuencias de videos. Ciertos tipos de RNN han ayudado a modelar datos espaciales y temporales para mayor precisión. Los enfoques híbridos combinan técnicas tradicionales con modelos de aprendizaje profundo para aprovechar las mejores características.

Mejores prácticas de sustracción de fondo

A continuación se presentan ciertas mejores prácticas que deben considerarse al implementar la sustracción de fondo de manera efectiva.

  • Utiliza datos limpios y bien preparados para mejorar la precisión de los resultados. Algunos pasos de preprocesamiento de datos a considerar antes de analizar los datos son la reducción de ruido, la conversión de espacio de color, la mejora de imágenes y la calibración.
  • Ajusta los parámetros de los algoritmos de sustracción de fondo para un rendimiento optimizado. La selección de umbrales, la tasa de aprendizaje, el historial y las métricas de evaluación son algunos enfoques para el ajuste de parámetros.
  • Elige un algoritmo relevante considerando las características de los datos y la robustez del algoritmo para alinearse con los datos y los objetivos del proyecto.
  • Haz consideraciones de hardware para asegurar un procesamiento eficiente para aplicaciones en vivo como realidad aumentada o vigilancia por video en cortos períodos. Esto ayuda a verificar los mejores resultados para la aceleración de la unidad de procesamiento gráfico (GPU), el uso eficiente de la memoria, la paralelización y la compatibilidad de hardware.

Aprende más sobre modelado estadístico para preparar datos para un análisis eficiente y práctico.

Sagar Joshi
SJ

Sagar Joshi

Sagar Joshi is a former content marketing specialist at G2 in India. He is an engineer with a keen interest in data analytics and cybersecurity. He writes about topics related to them. You can find him reading books, learning a new language, or playing pool in his free time.