¿Cómo usar esta herramienta?
- Suelte el vídeo arrastrándolo o ábralo desde el diálogo de archivo (MP4, MOV, WebM, hasta FullHD 1920×1080, hasta 500 MB).
- Elija el modelo: Calidad (mejores contornos del cabello, mayor exigencia de hardware) o Rápido (para vídeos largos y dispositivos más modestos).
- Elija el modo de salida: Transparente (WebM con canal alfa) o Color sólido (MP4 con el color de fondo elegido).
- Espere a la descarga del modelo — una sola vez, luego queda en la caché del navegador, también disponible sin conexión.
- Revise la vista previa y descargue el vídeo final.
Por qué otros servicios tienen que subir su vídeo
Los servicios basados en la nube para la eliminación de fondo de vídeo tienen que transferir primero su vídeo a un servidor, procesarlo allí y luego devolverle una URL de descarga. No se trata de un error de diseño, sino de algo arquitectónicamente inevitable: la inferencia de IA en un clúster de GPU cuesta dinero, refinanciado mediante suscripciones, marcas de agua, créditos o ingresos publicitarios.
El problema para las grabaciones privadas: no tiene control sobre lo que ocurre con el vídeo en el servidor, cuánto tiempo permanece almacenado o si ha entrado en datos de entrenamiento. Los servicios en la nube además se apagan con regularidad — si el proveedor cesa el negocio, todos los datos enviados se pierden.
Los navegadores modernos pueden invertir esta ecuación. A través de la interfaz WebGPU, el navegador accede directamente a la tarjeta gráfica de su dispositivo y ejecuta el modelo de IA completamente en local. El modelo carga una sola vez, se guarda en la caché del navegador y está disponible inmediatamente después — también sin conexión.
La especificación WebGPU del W3C está, según su resumen, explícitamente diseñada para mapearse de forma eficiente sobre APIs de GPU nativas modernas (posteriores a 2014) — esta arquitectura es lo que hace, por primera vez, que la inferencia de IA basada en el navegador y ejecutada en la tarjeta gráfica esté madura para la práctica.
¿Cómo funciona la eliminación del fondo?
La herramienta combina tres interfaces de navegador modernas disponibles desde 2024 en todos los navegadores de escritorio actuales:
Decodificación de vídeo en el navegador: Su vídeo se desempaqueta fotograma a fotograma sin necesidad de instalar una biblioteca de códec externa. El navegador usa el decodificador por hardware integrado de su GPU — el mismo que se utiliza también al retransmitir contenidos.
Inferencia de IA en la tarjeta gráfica: Una red neuronal especializada en segmentación de imagen se ejecuta directamente en la GPU. Para cada fotograma calcula una máscara alfa: una imagen en escala de grises que indica, para cada píxel, en qué medida pertenece al primer plano. La entrada se escala a un tamaño estandarizado y el resultado se recalcula a continuación de forma bilineal a la resolución original.
«WebGPU proporciona una API que hace accesibles las capacidades del hardware GPU a la web y permite operaciones como renderizado y cálculo directamente en una Graphics Processing Unit.»
— W3C: WebGPU Specification, traducción libre
Composición de fotograma y codificación: El fotograma enmascarado se combina con el fondo elegido y se vuelve a codificar. En la salida transparente surge un contenedor WebM con VP9 y canal alfa — el formato que DaVinci Resolve, Premiere Pro y After Effects pueden leer. Con fondo sólido surge un MP4 con H.264, reproducible de forma universal en cualquier dispositivo.
¿Cómo elijo el modo correcto?
El modo Calidad utiliza un modelo de segmentación de imagen muy avanzado, optimizado para estructuras finas — especialmente contornos del cabello, pelaje y objetos de vidrio. Ideal para grabaciones de personas en las que las transiciones deben verse limpias. Requiere una tarjeta gráfica moderna.
El modo Rápido utiliza un modelo de retrato más ligero, que ofrece un rendimiento cercano al tiempo real en portátiles modernos con WebGPU y que también se ejecuta de forma fiable en modo CPU en dispositivos más modestos. La calidad de los contornos del cabello queda ligeramente por debajo del modo Calidad — a cambio, es la mejor opción para vídeos largos y hardware antiguo.
Si su hardware no admite el modo Calidad, la herramienta cambia automáticamente al modo Rápido — sin mensaje de error en mitad del procesamiento.
Privacidad y Reglamento UE de IA
El vídeo no abandona su navegador en ningún momento. No se establece ninguna cookie que registre el nombre de archivo o la resolución de su archivo. Sin registro, sin dirección de correo electrónico, sin cuenta.
Una vez finalizado el proceso, la página muestra la indicación: «Este vídeo se ha editado con IA (fondo eliminado o sustituido).» Esto corresponde a la obligación de etiquetado del Reglamento UE de IA (artículo 50), que se aplica desde el 02/08/2026 a los medios manipulados por IA. La indicación es informativa y no resulta vinculante para usted — la responsabilidad de un etiquetado visible al volver a publicar el contenido le corresponde.
Los detalles técnicos están en la declaración de privacidad.
¿Qué límites tiene la herramienta?
Una gestión honesta de las expectativas en lugar de promesas de marketing:
Coherencia temporal: El modelo de IA empleado procesa cada fotograma de forma independiente — no conoce el fotograma anterior. En los contornos del cabello en movimiento, esto puede hacerse visible como un ligero parpadeo. Modelos de matting de vídeo dedicados serían más robustos, pero actualmente todavía no están disponibles con una licencia adecuada para uso libre en la web.
Pistas de audio: El vídeo de salida contiene, en la primera versión, exclusivamente la pista de imagen. Flujo de trabajo: dejar el vídeo original abierto en paralelo y colocar la pista de audio en el programa de edición sobre el vídeo recortado — sin desfase de sincronía labial, ya que la velocidad de fotogramas y el número de fotogramas permanecen idénticos.
Hardware: El modo Calidad requiere una tarjeta gráfica moderna con compatibilidad con WebGPU. En dispositivos Windows más antiguos o en iOS Safari se ejecuta automáticamente el modo Rápido.
Resolución: Entrada máxima FullHD (1920×1080). Las resoluciones superiores se rechazan, ya que los modelos de IA del navegador remuestrean internamente el 4K a 1024 píxeles, lo que produce artefactos de suavizado visibles en los contornos del cabello. Tamaño de archivo: Límite recomendado de 500 MB.
Preguntas frecuentes
¿Cómo elimino el fondo de un vídeo sin subirlo a un servidor?
Arrastra el vídeo (hasta FullHD 1920×1080, hasta 500 MB) a la zona de soltar en esta página. El modelo de IA se ejecuta directamente en su navegador — ningún servidor recibe su archivo. Descarga el vídeo final como WebM (transparente) o MP4 (sólido).
¿Necesito un registro o una cuenta?
No. No hay registro, ni inicio de sesión, ni cuenta. Abre la página, arrastra su vídeo, descarga el resultado — listo. Tampoco hay marcas de agua, ni límites de créditos, ni muros de pago ocultos. La salida es compatible con los programas de edición habituales (DaVinci Resolve, Premiere Pro, Final Cut Pro).
¿Por qué parpadea el fondo en los contornos del cabello?
El modelo de IA calcula una nueva máscara alfa para cada fotograma, sin conocer el fotograma anterior. En las fronteras subpíxel, la máscara puede oscilar uno o dos píxeles, lo que se hace visible como un ligero parpadeo. Para máxima estabilidad se recomienda un suavizado de bordes posterior en el programa de edición o un suavizado sobre la máscara.
¿Se conservan las pistas de audio?
En la primera versión no — el vídeo de salida contiene exclusivamente la pista de imagen. Recomendación de flujo: dejar el vídeo original abierto en paralelo, colocar el audio en el programa de edición (DaVinci Resolve, Premiere Pro, Final Cut) sobre el vídeo recortado — sin desfase de sincronía labial, ya que la velocidad de fotogramas y el número de fotogramas de ambas pistas permanecen idénticos. El paso directo de audio está previsto para una versión posterior.
¿Dónde se ejecuta exactamente el procesamiento?
Todo ocurre en la pestaña de su navegador — en su CPU o (si está disponible) en su tarjeta gráfica a través de la interfaz WebGPU. No hay envío a ningún servidor, ni API externa, ni conexión a la nube en la ruta de procesamiento. La única conexión de red en la primera llamada descarga el modelo de IA una sola vez; después todo permanece sin conexión.
¿Qué herramientas de vídeo están emparentadas?
Otras herramientas del ecosistema kittokit que encajan con el tema:
- HEVC a H.264 — Convertir vídeos de iPhone (HEVC/MOV) a MP4 H.264 reproducible de forma universal, también sin enviarlos a un servidor.
- Eliminar fondo — Recortar el fondo de imágenes individuales (JPG, PNG, HEIC), basado en IA y sin subida a servidor.
- Desenfocar fondo de webcam — Suavizar el fondo en la imagen de cámara en directo en tiempo real, para videollamadas sin salas virtuales.
Última actualización: