Saltar al contenido
Runs local · no upload

HTML a Markdown

Convierte ficheros HTML o fragmentos pegados a Markdown — con pase de saneamiento y salida GFM.

Cómo funciona

  1. 01

    Aportar el HTML

    Fichero mediante arrastrar y soltar o HTML directamente en el campo de pegado — ambos modos siguen el mismo camino.

  2. 02

    Revisar el saneamiento

    Los scripts y los gestores en línea se eliminan por defecto. Los enlaces de recursos externos se conservan como enlaces Markdown.

  3. 03

    Obtener el Markdown

    La vista previa en vivo muestra el resultado. Botón Copiar al portapapeles o descarga como `.md`.

Privacidad

No hay ningún camino de servidor. El HTML se analiza en la pestaña del navegador, se sanea y se convierte a Markdown. Tampoco el campo de pegado se comunica con ningún servidor — el contenido permanece en la pestaña.

HTML está en todas partes — en exportaciones web, código fuente de correos electrónicos, copias de seguridad de notas, contenidos extraídos de la web. Markdown es el formato en el que el conocimiento se mantiene hoy a largo plazo. Esta herramienta toma HTML — sea como fichero o pegado — y devuelve Markdown limpio.

01 — Cómo usarlo

¿Cómo usar esta herramienta?

  1. Arrastrar y soltar un fichero HTML — o pegar código HTML directamente en el campo
  2. Opcional: revisar las opciones de saneamiento (¿scripts fuera, imágenes externas conservadas?)
  3. Pulsar «Convertir» y descargar el Markdown o copiarlo con el botón Copiar

¿Para qué HTML a Markdown?

HTML es el formato fuente de la web — y, muy a menudo, la forma de datos en la que se encuentra el conocimiento: un boletín de correo electrónico que solo se puede buscar como fuente HTML; una copia de seguridad de notas de Evernote o OneNote; un artículo extraído de la web; una exportación de entrada de blog desde un CMS. Markdown, en cambio, es el formato en el que el conocimiento se mantiene a largo plazo — comparable mediante diff, en texto plano, legible en cualquier editor, entendido de forma nativa por Obsidian y Logseq.

Esta herramienta construye el puente. Le entrega un fichero HTML o código fuente HTML, la herramienta analiza la estructura DOM, sanea los scripts y los gestores en línea y escribe GitHub Flavored Markdown con los encabezados, listas, tablas y formatos en línea preservados.

¿Cómo funciona técnicamente la conversión?

El HTML se convierte en estructura DOM mediante el analizador HTML nativo del navegador — el mismo mecanismo que cualquier página web utiliza internamente, pero en modo aislado sin ejecución de scripts. Una capa de saneamiento elimina las etiquetas <script>, los bloques <style>, los gestores de eventos en línea y las incrustaciones <iframe> antes de que el DOM se procese más adelante. Así, incluso los ficheros HTML extraídos de la web o descargados de terceros pueden convertirse de forma segura.

Una biblioteca de código abierto HTML-a-Markdown probada traduce la estructura DOM a Markdown: encabezados (<h1>#, <h2>##), párrafos (<p> → línea vacía entre bloques), listas (<ul>-, <ol>1.), tablas (<table> → tablas GFM con barras verticales), formatos en línea (<strong>**, <em>*, <code>`).

¿Para qué se usa la herramienta?

  • Archivar boletines de correo electrónico. Los boletines en formato HTML pasan como Markdown a la bóveda de Obsidian.
  • Preparar contenido web para indicaciones de IA. Un artículo largo pasa a Markdown que cabe en la indicación de Claude o GPT.
  • Migración de notas desde Evernote / OneNote. Las exportaciones de notas en HTML aterrizan como ficheros .md limpios en el nuevo sistema de notas.
  • Migración de blog a Hugo / Astro. Las entradas existentes en HTML pasan a entradas Markdown con frontmatter que entienden los generadores de sitios estáticos.
  • Contenido wiki desde exportaciones de Confluence. Las exportaciones HTML de Confluence/SharePoint pasan a páginas Markdown para alternativas a Notion.

¿Qué se preserva?

Preservado: jerarquías de encabezados (<h1> a <h6>), párrafos, listas ordenadas y no ordenadas con anidamiento, tablas sin fusiones como tablas GFM con barras verticales, formatos en línea (negrita, cursiva, código en línea, tachado), hipervínculos con texto de ancla, citas en bloque, bloques de código con indicación de lenguaje, imágenes como referencias Markdown (el src original se conserva).

Eliminado deliberadamente: scripts, bloques <style>, gestores de eventos en línea, iframes externos (pase de seguridad). Esto es innegociable — sobre todo en HTML extraído o recortado de la web, protege contra cargas útiles de script ocultas.

No convertible 1:1: tablas con colspan/rowspan (bloque de aviso, porque las tablas Markdown con barras verticales no soportan fusión de celdas), trucos de maquetación CSS, contenido generado por JavaScript (el pase de saneamiento llega antes de la ejecución de scripts — el contenido JS no se renderiza).

Privacidad — todo se queda en la pestaña del navegador

Cuando analiza una exportación HTML de una aplicación de notas privada, lo último que desea es que el contenido vaya a un servidor ajeno. También en el archivo de boletines pueden esconderse identificadores de seguimiento confidenciales o campos de tratamiento personalizados en el HTML.

Aquí no ocurre nada de eso. El HTML se analiza en la pestaña del navegador mediante estándares web (analizador HTML nativo del navegador, WebAssembly) y se convierte a Markdown. Puede abrir el panel de red de las herramientas de desarrollo y observar: ninguna petición, ninguna subida, ninguna comunicación con servidor. También el campo de pegado trabaja completamente del lado del cliente.

¿Qué convertidores relacionados hay?

Esta herramienta es parte de la familia de convertidores Markdown:

Última actualización:

También le puede interesar