Saltar al contenido
Runs local · no upload

Mapas de profundidad desde fotos — en el navegador

Foto dentro, mapa de profundidad fuera. Una red neuronal especializada estima la profundidad a partir de una única imagen — píxel a píxel, sin cámara estéreo, directamente en su dispositivo.

Elija una imagen o suéltela aquí

PNG, JPG, WebP, AVIF o HEIC hasta 20 MB

PNGJPGWEBPAVIFHEICHEIF

Cómo funciona

  1. 01

    Elegir la foto

    Arrastre y suelte un archivo o selecciónelo del dispositivo. PNG, JPG, WebP, AVIF o HEIC hasta 20 MB.

  2. 02

    Elegir el modelo

    Rápido para cualquier dispositivo (unos 19 MB, sin WebGPU), Nítido para transiciones más finas en navegadores modernos. La herramienta oculta automáticamente las opciones no disponibles.

  3. 03

    Guardar el mapa

    El mapa aparece junto al original. Cargue PNG para resultado sin pérdida, WebP para tamaño compacto, JPG para máxima compatibilidad.

Privacidad

El procesamiento se ejecuta exclusivamente en su dispositivo. Sus fotos no abandonan el navegador, no se transfieren a servidores y se borran al cerrar la pestaña. Así la herramienta cumple el RGPD — apta para fotos de producto, visuales comerciales o tomas confidenciales.

Una foto normal se convierte con un clic en un mapa de profundidad: las zonas claras están cerca, las oscuras lejos. Esa información es lo que necesitan los artistas para el compositing, los fotógrafos para simular bokeh, los modeladores 3D como mapa de alturas y los desarrolladores como entrada para efectos AR.

01 — Cómo usarlo

¿Cómo usar esta herramienta?

  1. Seleccione una foto o arrástrela (PNG, JPG, WebP, AVIF o HEIC hasta 20 MB)
  2. Elija el modelo: Rápido funciona en cualquier dispositivo; Nítido necesita WebGPU para transiciones de profundidad más finas
  3. Descarga única del modelo en segundo plano (unos 19 MB rápido, unos 50 MB nítido), después en caché
  4. El mapa de profundidad aparece como imagen en escala de grises junto al original
  5. Descargue como PNG, WebP o JPG — la salida conserva la resolución original

¿Qué hace la herramienta?

La herramienta genera a partir de una sola foto un mapa de profundidad (depth map) — una imagen en escala de grises que codifica por píxel la distancia estimada a la cámara. Las zonas claras significan «cerca», las oscuras «lejos». El cálculo se ejecuta totalmente en su navegador mediante WebAssembly o WebGPU y una red neuronal especializada, entrenada precisamente para estimación de profundidad monocular — es decir, inferencia de profundidad a partir de una única imagen fija, sin cámara estéreo ni sensor dedicado.

La salida es un PNG completo (sin pérdida), WebP (compacto) o JPG (universal) que lee cualquier programa de edición. Resolución y proporción permanecen idénticas al original; la herramienta escala automáticamente el mapa calculado internamente al tamaño de entrada.

¿Cómo funciona la estimación de profundidad por IA?

Estimar profundidad a partir de una sola imagen es un problema clásico de visión por computador. Los métodos estéreo necesitan dos tomas desde ángulos ligeramente distintos, los sensores Time-of-Flight requieren hardware especial. En una instantánea normal solo hay una imagen 2D — la máquina debe reconstruir qué está delante y qué detrás a partir de pistas indirectas.

El modelo se apoya en patrones aprendidos: escorzo perspectivo (las líneas paralelas convergen en la distancia), coherencia de tamaños (una persona parece mayor en primer plano que a lo lejos), oclusión (un objeto delante de otro está más cerca), gradientes de textura (las estructuras se afinan con la distancia), dispersión atmosférica (los objetos lejanos pierden contraste) y estadísticas de escenas aprendidas en millones de imágenes. El resultado es una información de profundidad relativa — sabe qué está más cerca o más lejos, pero no la distancia absoluta en metros.

Todo el proceso se ejecuta en su navegador. En el primer acceso, el modelo se descarga una vez desde un repositorio público (unos 19 MB en la variante rápida, unos 50 MB en la nítida); después queda en caché y funciona sin conexión. Cada estimación posterior dura 3 a 15 segundos según el dispositivo y el tamaño de la imagen.

¿Cuándo da buenos resultados la herramienta?

Las escenas naturales con estructura clara primer plano / fondo son el punto óptimo. Retratos, paisajes, interiores, escenas de calle, fotografía de arquitectura — donde la imagen muestra una composición espacialmente estructurada, el modelo produce mapas limpios. Las fotos de producto con fondo desenfocado también funcionan bien.

Los casos difíciles caen en tres categorías:

  • Imágenes planas y poco texturizadas — paredes uniformes, cielos puros, fondos lisos. Al modelo le faltan pistas visuales y el mapa queda plano o ruidoso.
  • Ilusiones ópticas y trampantojos — ilusiones de profundidad intencionales en pinturas, reflejos en espejos y ventanas pueden confundir al modelo.
  • Tomas microscópicas o macroscópicas — imágenes de microscopio y astronomía no siguen las pistas naturales de los datos de entrenamiento y dan estimaciones poco fiables.

En tomas cotidianas — fotos de móvil, réflex, tomas con dron — el modelo está en su mundo de entrenamiento y produce resultados utilizables para los usos habituales.

¿Para qué puedo usar un mapa de profundidad?

El mapa es una imagen universal en escala de grises y encaja en muchos flujos:

  • Simulación de bokeh y desenfoque por profundidad — en programas como Adobe Photoshop, Affinity Photo o GIMP como máscara de profundidad para desenfoque selectivo, para convertir una instantánea de móvil en una imagen con aspecto profesional y fondo suave.
  • Compositing entre capas de foto — separar primer y segundo plano mediante máscara de profundidad, insertar objetos nuevos de forma espacialmente coherente, falsa profundidad de campo para stock photo.
  • Modelado 3D — entrada para Blender, Cinema 4D u otro software 3D como mapa de desplazamiento o de alturas, para generar una superficie 3D a partir de una foto 2D.
  • Efectos AR y VR — efectos basados en profundidad en implementaciones Web-AR, animaciones de paralaje en sitios web, galerías de imágenes inmersivas.
  • Educación e investigación — mapas de profundidad como material didáctico en cursos de visión por computador, visualización de estructuras espaciales en fotografía de arquitectura.

El mapa no es adecuado para vehículos autónomos, manipulación robótica ni mediciones médicas de profundidad — esos usos requieren sensórica calibrada, no una estimación IA relativa.

¿Mi foto es realmente privada?

La estimación de profundidad se ejecuta exclusivamente en su dispositivo. Ni el original ni el mapa calculado se envían a un servidor, se almacenan ni se analizan. No hay banner de cookies de terceros, ni registro, ni seguimiento — tampoco análisis de uso anónimo.

La única excepción es la descarga única del modelo en el primer acceso: el archivo del modelo se carga una vez desde un repositorio público. Esa solicitud solo contiene la URL del archivo. No se transmiten datos de imagen, ni identificadores de usuario, ni información personal identificable. Técnicamente, el proveedor del modelo ve la dirección IP y el User-Agent del navegador que hace la descarga — los mismos datos que su proveedor de Internet ve en cada carga de página. Tras la primera carga, el modelo vive en la caché del navegador y el CDN ya no se contacta.

Para material sensible como prototipos de producto, visuales confidenciales o tomas inéditas, esa es la ventaja decisiva frente a herramientas en la nube que deben subir el archivo.

¿Qué dice el Reglamento europeo de IA sobre las imágenes generadas?

A partir de agosto de 2026, el art. 50 del Reglamento europeo de IA exige que los contenidos generados por IA se etiqueten como tales. La herramienta muestra por ello, sobre cada mapa de profundidad generado, un aviso fijo y visible: «Este mapa de profundidad ha sido estimado por un modelo de IA. Revise los valores antes de usarlos — los modelos de IA pueden interpretar mal la profundidad en ilusiones ópticas o escenas inusuales.» Este aviso es obligatorio y no se puede ocultar.

En la práctica: el mapa es una sugerencia, no una medición vinculante. Para usos creativos (bokeh, compositing) la precisión es más que suficiente; para aplicaciones críticas de seguridad (sistemas autónomos, mediciones médicas de distancia, levantamientos topográficos) es obligatoria una solución sensorial calibrada.

Preguntas frecuentes

Lo esencial sobre uso, calidad y privacidad:

¿Cómo genero un mapa de profundidad a partir de una sola foto?

Suba su foto en la herramienta de arriba — el mapa se calcula totalmente en el navegador mediante IA. El modelo estima a partir del contenido de la imagen la profundidad relativa por píxel. No hace falta cámara estéreo ni sensor de profundidad.

¿La herramienta funciona sin conexión?

Sí. En el primer acceso, el navegador descarga una vez el modelo de IA (unos 19 MB). Después, todas las estimaciones siguientes se ejecutan totalmente sin conexión desde la caché.

¿Qué formatos de imagen puedo subir?

Entrada: PNG, JPG, WebP, AVIF y HEIC (fotos de iPhone). El HEIC se decodifica automáticamente antes del cálculo. Salida: PNG, WebP o JPG en escala de grises.

¿Cuánto dura una estimación?

Tras la descarga única del modelo, una estimación dura típicamente entre 3 y 15 segundos — según el dispositivo, la variante elegida y el tamaño de la imagen.

¿Qué herramientas de imagen combinan bien?

Otras herramientas del ecosistema kittokit que se combinan bien con la generación de mapas de profundidad:

  • Eliminar fondo — recorte por IA, a menudo el paso previo al compositing basado en profundidad.
  • Ampliar imagen — ampliar antes las imágenes pequeñas para que el mapa de profundidad gane detalle.
  • Foto a lámina para colorear — transformar fotos en dibujos lineales, complementario a la profundidad.
  • Convertidor de formato de imagen — convertir mapas de profundidad a otros formatos (PNG sin pérdida a WebP compacto).
  • Visor EXIF — leer los metadatos originales (cámara, focal, GPS), complementario a la estimación de profundidad.

Última actualización:

También le puede interesar