¿Cómo usar esta herramienta?
- Arrastrar y soltar un fichero HTML — o pegar código HTML directamente en el campo
- Opcional: revisar las opciones de saneamiento (¿scripts fuera, imágenes externas conservadas?)
- Pulsar «Convertir» y descargar el Markdown o copiarlo con el botón Copiar
¿Para qué HTML a Markdown?
HTML es el formato fuente de la web — y, muy a menudo, la forma de datos en la que se encuentra el conocimiento: un boletín de correo electrónico que solo se puede buscar como fuente HTML; una copia de seguridad de notas de Evernote o OneNote; un artículo extraído de la web; una exportación de entrada de blog desde un CMS. Markdown, en cambio, es el formato en el que el conocimiento se mantiene a largo plazo — comparable mediante diff, en texto plano, legible en cualquier editor, entendido de forma nativa por Obsidian y Logseq.
Esta herramienta construye el puente. Le entrega un fichero HTML o código fuente HTML, la herramienta analiza la estructura DOM, sanea los scripts y los gestores en línea y escribe GitHub Flavored Markdown con los encabezados, listas, tablas y formatos en línea preservados.
¿Cómo funciona técnicamente la conversión?
El HTML se convierte en estructura DOM mediante el analizador HTML
nativo del navegador — el mismo mecanismo que cualquier página web
utiliza internamente, pero en modo aislado sin ejecución de scripts.
Una capa de saneamiento elimina las etiquetas <script>, los bloques
<style>, los gestores de eventos en línea y las incrustaciones
<iframe> antes de que el DOM se procese más adelante. Así, incluso
los ficheros HTML extraídos de la web o descargados de terceros pueden
convertirse de forma segura.
Una biblioteca de código abierto HTML-a-Markdown probada traduce la
estructura DOM a Markdown: encabezados (<h1> → #, <h2> → ##),
párrafos (<p> → línea vacía entre bloques), listas (<ul> → -,
<ol> → 1.), tablas (<table> → tablas GFM con barras verticales),
formatos en línea (<strong> → **, <em> → *, <code> → `).
¿Para qué se usa la herramienta?
- Archivar boletines de correo electrónico. Los boletines en formato HTML pasan como Markdown a la bóveda de Obsidian.
- Preparar contenido web para indicaciones de IA. Un artículo largo pasa a Markdown que cabe en la indicación de Claude o GPT.
- Migración de notas desde Evernote / OneNote. Las exportaciones
de notas en HTML aterrizan como ficheros
.mdlimpios en el nuevo sistema de notas. - Migración de blog a Hugo / Astro. Las entradas existentes en HTML pasan a entradas Markdown con frontmatter que entienden los generadores de sitios estáticos.
- Contenido wiki desde exportaciones de Confluence. Las exportaciones HTML de Confluence/SharePoint pasan a páginas Markdown para alternativas a Notion.
¿Qué se preserva?
Preservado: jerarquías de encabezados (<h1> a <h6>), párrafos,
listas ordenadas y no ordenadas con anidamiento, tablas sin fusiones
como tablas GFM con barras verticales, formatos en línea (negrita,
cursiva, código en línea, tachado), hipervínculos con texto de ancla,
citas en bloque, bloques de código con indicación de lenguaje,
imágenes como referencias Markdown (el src original se conserva).
Eliminado deliberadamente: scripts, bloques <style>, gestores de
eventos en línea, iframes externos (pase de seguridad). Esto es
innegociable — sobre todo en HTML extraído o recortado de la web,
protege contra cargas útiles de script ocultas.
No convertible 1:1: tablas con colspan/rowspan (bloque de
aviso, porque las tablas Markdown con barras verticales no soportan
fusión de celdas), trucos de maquetación CSS, contenido generado por
JavaScript (el pase de saneamiento llega antes de la ejecución de
scripts — el contenido JS no se renderiza).
Privacidad — todo se queda en la pestaña del navegador
Cuando analiza una exportación HTML de una aplicación de notas privada, lo último que desea es que el contenido vaya a un servidor ajeno. También en el archivo de boletines pueden esconderse identificadores de seguimiento confidenciales o campos de tratamiento personalizados en el HTML.
Aquí no ocurre nada de eso. El HTML se analiza en la pestaña del
navegador mediante estándares web (analizador HTML nativo del
navegador, WebAssembly) y se convierte a Markdown. Puede abrir el
panel de red de las herramientas de desarrollo y observar: ninguna
petición, ninguna subida, ninguna comunicación con servidor. También
el campo de pegado trabaja completamente del lado del cliente.
¿Qué convertidores relacionados hay?
Esta herramienta es parte de la familia de convertidores Markdown:
- DOCX a Markdown — documentos Word con estructura de encabezados y listas.
- PDF a Markdown — también PDF escaneados vía OCR.
- CSV a Markdown — también TSV con auto-detección de delimitador.
- XLSX a Markdown — Excel, incluidos XLS y ODS, con soporte multihoja.
Última actualización: