Mon HTML est-il uploadé ?

Non. Le HTML est parsé exclusivement dans l'onglet navigateur et converti en Markdown. Il n'y a aucun endpoint serveur, aucun upload, aucune télémétrie. Vous pouvez le vérifier vous-même dans l'onglet réseau des outils de développement.

Que fait la passe de sanitization ?

Les balises ` `, les gestionnaires d'événements inline (`onclick`, `onload` etc.), les blocs ` ` et les iframes externes sont supprimés avant la conversion. C'est dans le chemin standard et protège contre du contenu de script caché dans du HTML clippé ou scrapé.

Que deviennent les images ?

Les balises image deviennent des références d'image Markdown (`![alt](src)`). Les URL d'image externes restent comme lien — elles ne sont pas téléchargées, puisque l'outil ne fait pas de requêtes serveur. Pour embarquer les images, téléchargez-les séparément et référencez-les en relatif.

Les tableaux sont-ils supportés ?

Oui, les structures ` ` avec ` `, ` `, ` ` et ` ` deviennent des tableaux Markdown GitHub-Flavored à pipes. Les tableaux complexes avec `colspan`/`rowspan` sont marqués d'un bloc d'avertissement — les tableaux Markdown à pipes ne supportent pas la fusion de cellules.

Le champ de collage fonctionne-t-il avec du code venant de l'inspecteur navigateur ?

Oui. Vous pouvez copier un nœud DOM en HTML depuis les outils de développement (`Copy outerHTML`) et le coller directement dans le champ. La passe de sanitization s'occupe des attributs inutiles, le Markdown reste épuré.

Que deviennent les formatages inline ?

` `/` ` → **gras**, ` `/` ` → *italique*, ` ` → `code inline`, ` ` → `[Texte](URL)`, ` ` → `>` citation en bloc, ` `/` ` → listes `- ` et `1. `. Les balises inhabituelles ou visuelles (` `, ` `, ` `) sont ignorées.

Quelle taille maximale pour le HTML ?

Jusqu'à environ 5 Mo par fichier ou bloc collé est réaliste — cela couvre de très longs articles ou des exports web complets. Plus est possible, mais la RAM navigateur est la limite, et le Markdown devient vite difficile à appréhender.

Puis-je aussi l'utiliser avec des URL de sites externes ?

Le fetching d'URL n'est pas inclus dans cette version — cela aurait des implications CORS, rate-limit et CGU que nous ne mettons délibérément pas dans l'outil navigateur. Pour convertir une page web, copiez le code source HTML depuis le navigateur (`Ctrl+U` → Tout copier) et collez-le dans le champ.

HTML en Markdown — mode fichier ou collage, navigateur

Pourquoi HTML vers Markdown ?

HTML est le format source du web — et très souvent la forme de données dans laquelle vous trouvez du savoir : une newsletter e-mail uniquement consultable comme source HTML ; une sauvegarde de notes d’Evernote ou OneNote ; un article scrapé ; un export de billet de blog depuis un CMS. Markdown est en revanche le format dans lequel vous entretenez le savoir sur le long terme — diffable, plain-text, lisible dans tout éditeur, nativement compris par Obsidian et Logseq.

Cet outil bâtit le pont. Vous y jetez un fichier HTML ou du code source HTML, l’outil parse la structure DOM, sanitize scripts et gestionnaires inline et écrit du GitHub Flavored Markdown avec titres, listes, tableaux et formats inline préservés.

Comment fonctionne techniquement la conversion ?

Le HTML est converti en structure DOM par le parseur HTML natif du navigateur — le même mécanisme qu’utilise toute page web en interne, mais en mode sandbox sans exécution de script. Une couche de sanitization supprime les balises <script>, les blocs <style>, les gestionnaires d’événements inline et les embeds <iframe> avant que le DOM soit traité plus loin. Ainsi, même des fichiers HTML scrapés ou téléchargés peuvent être convertis en sécurité.

Une bibliothèque open-source HTML-vers-Markdown éprouvée traduit la structure DOM en Markdown : titres (<h1> → #, <h2> → ##), paragraphes (<p> → ligne vide entre blocs), listes (<ul> → -, <ol> → 1.), tableaux (<table> → tableaux GFM à pipes), formats inline (<strong> → **, <em> → *, <code> → `).

À quoi l’outil sert-il ?

Archiver des newsletters e-mail. Les newsletters au format HTML passent en Markdown dans le vault Obsidian.
Préparer du contenu web pour prompts IA. Un long article devient un Markdown qui rentre dans le prompt Claude ou GPT.
Migration de notes depuis Evernote / OneNote. Les exports de notes en HTML atterrissent en fichiers .md propres dans le nouveau système.
Migration de blog vers Hugo / Astro. Les billets existants en HTML deviennent des posts Markdown avec frontmatter que comprennent les générateurs de sites statiques.
Contenu wiki depuis des exports Confluence. Les exports HTML de Confluence/SharePoint deviennent des pages Markdown pour alternatives Notion.

Qu’est-ce qui est préservé ?

Préservé : hiérarchies de titres (<h1> à <h6>), paragraphes, listes ordonnées et non ordonnées avec imbrication, tableaux sans fusion comme tableaux GFM à pipes, formats inline (gras, italique, code inline, barré), liens hypertextes avec texte d’ancre, citations en bloc, blocs de code avec hint de langue, images comme références Markdown (le src d’origine reste).

Délibérément supprimé : scripts, blocs <style>, gestionnaires d’événements inline, iframes externes (passe de sécurité). C’est non-négociable — surtout pour du HTML scrapé ou clippé, cela protège contre des payloads de script cachés.

Pas convertible 1:1 : tableaux avec colspan/rowspan (bloc d’avertissement, parce que les tableaux Markdown à pipes ne supportent pas la fusion de cellules), astuces de mise en page CSS, contenu généré par JavaScript (la passe de sanitization vient avant l’exécution de script — le contenu JS n’est pas rendu).

Confidentialité — tout reste dans l’onglet navigateur

Quand vous parsez un export HTML d’une appli de notes privée, la dernière chose que vous voulez est que le contenu parte sur un serveur tiers. Aussi dans une archive de newsletter, des IDs de tracking confidentiels ou des champs d’adresse personnalisés peuvent se cacher dans le HTML.

Ici rien de tout cela. Le HTML est parsé dans l’onglet navigateur via des standards web (parseur HTML natif du navigateur, WebAssembly) et converti en Markdown. Vous pouvez ouvrir le panneau réseau des outils de développement et observer : aucune requête, aucun upload, aucune communication serveur. Le champ de collage aussi travaille entièrement côté client.

Quels convertisseurs proches existent ?

Cet outil fait partie de la famille des convertisseurs Markdown :

DOCX en Markdown — documents Word avec structure de titres et listes.
PDF en Markdown — aussi PDF scannés via OCR.
CSV en Markdown — aussi TSV avec auto-détection du délimiteur.
XLSX en Markdown — Excel incl. XLS et ODS, multi-feuilles.

HTML en Markdown

Comment ça marche

Apporter le HTML

Vérifier la sanitization

Récupérer le Markdown

Confidentialité

Comment utiliser cet outil ?