Aller au contenu
Runs local · no upload

HTML en Markdown

Convertit fichiers HTML ou extraits collés en Markdown — avec passe de sanitization et sortie GFM.

Comment ça marche

  1. 01

    Apporter le HTML

    Fichier en glisser-déposer ou HTML directement dans le champ de collage — les deux modes passent par le même chemin.

  2. 02

    Vérifier la sanitization

    Scripts et gestionnaires inline sont supprimés par défaut. Les liens de ressources externes restent comme liens Markdown.

  3. 03

    Récupérer le Markdown

    L'aperçu live montre le résultat. Bouton Copier vers le presse-papiers ou téléchargement en `.md`.

Confidentialité

Il n'y a pas de chemin serveur. Le HTML est parsé dans l'onglet navigateur, sanitizé et converti en Markdown. Le champ de collage non plus ne communique avec aucun serveur — le contenu reste dans l'onglet.

HTML est partout — dans les exports web, le code source d'e-mails, les sauvegardes de notes, les contenus scrapés. Markdown est le format dans lequel le savoir est aujourd'hui maintenu sur le long terme. Cet outil prend du HTML — soit en fichier soit par collage — et renvoie du Markdown propre.

01 — Mode d’emploi

Comment utiliser cet outil ?

  1. Glisser-déposer un fichier HTML — ou coller du code HTML directement dans le champ
  2. Optionnel : vérifier les options de sanitization (scripts retirés, images externes conservées ?)
  3. Cliquer « Convertir » et récupérer le Markdown ou l'attraper via le bouton Copier

Pourquoi HTML vers Markdown ?

HTML est le format source du web — et très souvent la forme de données dans laquelle vous trouvez du savoir : une newsletter e-mail uniquement consultable comme source HTML ; une sauvegarde de notes d’Evernote ou OneNote ; un article scrapé ; un export de billet de blog depuis un CMS. Markdown est en revanche le format dans lequel vous entretenez le savoir sur le long terme — diffable, plain-text, lisible dans tout éditeur, nativement compris par Obsidian et Logseq.

Cet outil bâtit le pont. Vous y jetez un fichier HTML ou du code source HTML, l’outil parse la structure DOM, sanitize scripts et gestionnaires inline et écrit du GitHub Flavored Markdown avec titres, listes, tableaux et formats inline préservés.

Comment fonctionne techniquement la conversion ?

Le HTML est converti en structure DOM par le parseur HTML natif du navigateur — le même mécanisme qu’utilise toute page web en interne, mais en mode sandbox sans exécution de script. Une couche de sanitization supprime les balises <script>, les blocs <style>, les gestionnaires d’événements inline et les embeds <iframe> avant que le DOM soit traité plus loin. Ainsi, même des fichiers HTML scrapés ou téléchargés peuvent être convertis en sécurité.

Une bibliothèque open-source HTML-vers-Markdown éprouvée traduit la structure DOM en Markdown : titres (<h1>#, <h2>##), paragraphes (<p> → ligne vide entre blocs), listes (<ul>-, <ol>1.), tableaux (<table> → tableaux GFM à pipes), formats inline (<strong>**, <em>*, <code>`).

À quoi l’outil sert-il ?

  • Archiver des newsletters e-mail. Les newsletters au format HTML passent en Markdown dans le vault Obsidian.
  • Préparer du contenu web pour prompts IA. Un long article devient un Markdown qui rentre dans le prompt Claude ou GPT.
  • Migration de notes depuis Evernote / OneNote. Les exports de notes en HTML atterrissent en fichiers .md propres dans le nouveau système.
  • Migration de blog vers Hugo / Astro. Les billets existants en HTML deviennent des posts Markdown avec frontmatter que comprennent les générateurs de sites statiques.
  • Contenu wiki depuis des exports Confluence. Les exports HTML de Confluence/SharePoint deviennent des pages Markdown pour alternatives Notion.

Qu’est-ce qui est préservé ?

Préservé : hiérarchies de titres (<h1> à <h6>), paragraphes, listes ordonnées et non ordonnées avec imbrication, tableaux sans fusion comme tableaux GFM à pipes, formats inline (gras, italique, code inline, barré), liens hypertextes avec texte d’ancre, citations en bloc, blocs de code avec hint de langue, images comme références Markdown (le src d’origine reste).

Délibérément supprimé : scripts, blocs <style>, gestionnaires d’événements inline, iframes externes (passe de sécurité). C’est non-négociable — surtout pour du HTML scrapé ou clippé, cela protège contre des payloads de script cachés.

Pas convertible 1:1 : tableaux avec colspan/rowspan (bloc d’avertissement, parce que les tableaux Markdown à pipes ne supportent pas la fusion de cellules), astuces de mise en page CSS, contenu généré par JavaScript (la passe de sanitization vient avant l’exécution de script — le contenu JS n’est pas rendu).

Confidentialité — tout reste dans l’onglet navigateur

Quand vous parsez un export HTML d’une appli de notes privée, la dernière chose que vous voulez est que le contenu parte sur un serveur tiers. Aussi dans une archive de newsletter, des IDs de tracking confidentiels ou des champs d’adresse personnalisés peuvent se cacher dans le HTML.

Ici rien de tout cela. Le HTML est parsé dans l’onglet navigateur via des standards web (parseur HTML natif du navigateur, WebAssembly) et converti en Markdown. Vous pouvez ouvrir le panneau réseau des outils de développement et observer : aucune requête, aucun upload, aucune communication serveur. Le champ de collage aussi travaille entièrement côté client.

Quels convertisseurs proches existent ?

Cet outil fait partie de la famille des convertisseurs Markdown :

Dernière mise à jour :

Vous pourriez aussi aimer