Comment utiliser cet outil ?
- Glisser-déposer un fichier HTML — ou coller du code HTML directement dans le champ
- Optionnel : vérifier les options de sanitization (scripts retirés, images externes conservées ?)
- Cliquer « Convertir » et récupérer le Markdown ou l'attraper via le bouton Copier
Pourquoi HTML vers Markdown ?
HTML est le format source du web — et très souvent la forme de données dans laquelle vous trouvez du savoir : une newsletter e-mail uniquement consultable comme source HTML ; une sauvegarde de notes d’Evernote ou OneNote ; un article scrapé ; un export de billet de blog depuis un CMS. Markdown est en revanche le format dans lequel vous entretenez le savoir sur le long terme — diffable, plain-text, lisible dans tout éditeur, nativement compris par Obsidian et Logseq.
Cet outil bâtit le pont. Vous y jetez un fichier HTML ou du code source HTML, l’outil parse la structure DOM, sanitize scripts et gestionnaires inline et écrit du GitHub Flavored Markdown avec titres, listes, tableaux et formats inline préservés.
Comment fonctionne techniquement la conversion ?
Le HTML est converti en structure DOM par le parseur HTML natif du
navigateur — le même mécanisme qu’utilise toute page web en interne,
mais en mode sandbox sans exécution de script. Une couche de
sanitization supprime les balises <script>, les blocs <style>, les
gestionnaires d’événements inline et les embeds <iframe> avant que le
DOM soit traité plus loin. Ainsi, même des fichiers HTML scrapés ou
téléchargés peuvent être convertis en sécurité.
Une bibliothèque open-source HTML-vers-Markdown éprouvée traduit la
structure DOM en Markdown : titres (<h1> → #, <h2> → ##),
paragraphes (<p> → ligne vide entre blocs), listes (<ul> → -,
<ol> → 1.), tableaux (<table> → tableaux GFM à pipes), formats
inline (<strong> → **, <em> → *, <code> → `).
À quoi l’outil sert-il ?
- Archiver des newsletters e-mail. Les newsletters au format HTML passent en Markdown dans le vault Obsidian.
- Préparer du contenu web pour prompts IA. Un long article devient un Markdown qui rentre dans le prompt Claude ou GPT.
- Migration de notes depuis Evernote / OneNote. Les exports de
notes en HTML atterrissent en fichiers
.mdpropres dans le nouveau système. - Migration de blog vers Hugo / Astro. Les billets existants en HTML deviennent des posts Markdown avec frontmatter que comprennent les générateurs de sites statiques.
- Contenu wiki depuis des exports Confluence. Les exports HTML de Confluence/SharePoint deviennent des pages Markdown pour alternatives Notion.
Qu’est-ce qui est préservé ?
Préservé : hiérarchies de titres (<h1> à <h6>), paragraphes,
listes ordonnées et non ordonnées avec imbrication, tableaux sans
fusion comme tableaux GFM à pipes, formats inline (gras, italique, code
inline, barré), liens hypertextes avec texte d’ancre, citations en
bloc, blocs de code avec hint de langue, images comme références
Markdown (le src d’origine reste).
Délibérément supprimé : scripts, blocs <style>, gestionnaires
d’événements inline, iframes externes (passe de sécurité). C’est
non-négociable — surtout pour du HTML scrapé ou clippé, cela protège
contre des payloads de script cachés.
Pas convertible 1:1 : tableaux avec colspan/rowspan (bloc
d’avertissement, parce que les tableaux Markdown à pipes ne supportent
pas la fusion de cellules), astuces de mise en page CSS, contenu généré
par JavaScript (la passe de sanitization vient avant l’exécution de
script — le contenu JS n’est pas rendu).
Confidentialité — tout reste dans l’onglet navigateur
Quand vous parsez un export HTML d’une appli de notes privée, la dernière chose que vous voulez est que le contenu parte sur un serveur tiers. Aussi dans une archive de newsletter, des IDs de tracking confidentiels ou des champs d’adresse personnalisés peuvent se cacher dans le HTML.
Ici rien de tout cela. Le HTML est parsé dans l’onglet navigateur via
des standards web (parseur HTML natif du navigateur, WebAssembly) et
converti en Markdown. Vous pouvez ouvrir le panneau réseau des outils
de développement et observer : aucune requête, aucun upload, aucune
communication serveur. Le champ de collage aussi travaille entièrement
côté client.
Quels convertisseurs proches existent ?
Cet outil fait partie de la famille des convertisseurs Markdown :
- DOCX en Markdown — documents Word avec structure de titres et listes.
- PDF en Markdown — aussi PDF scannés via OCR.
- CSV en Markdown — aussi TSV avec auto-détection du délimiteur.
- XLSX en Markdown — Excel incl. XLS et ODS, multi-feuilles.
Dernière mise à jour :