Convertissez du Word .docx en Markdown propre : titres, listes et tableaux préservés
Vous avez un fichier .docx venu de Word, d'un export Google Docs ou de LibreOffice et il vous le faut en Markdown pour votre README, votre site statique, votre billet de blog ou une note Notion / Obsidian. Copier-coller depuis Word vers un éditeur Markdown vous laisse avec un tas de déchets : guillemets typographiques, puces cassées, pas de titres.
Cet outil lit la structure OpenXML à l'intérieur de votre .docx (Word est en réalité une archive ZIP avec du XML dedans), mappe les styles de paragraphe sur les titres Markdown, les listes à puces et numérotées sur `-` et `1.`, les tableaux sur des tables GitHub-flavored, et gras / italique / liens sur leurs équivalents Markdown.
Tout le travail tourne côté serveur dans notre processus Node via `mammoth`, la même lib qu'utilisent en interne les outils style Pandoc. Le fichier est parsé en mémoire et écarté immédiatement, jamais écrit sur disque, jamais loggué. Vous voyez deux panneaux : le Markdown brut à gauche (copier ou télécharger), et un aperçu HTML en direct à droite pour vérifier le résultat avant de coller dans votre repo.
Mode d'emploi
- Déposez votre fichier .docx dans la dropzone, ou cliquez sur « Choose file ». Seul `.docx` est accepté, l'ancien format binaire `.doc` n'est pas pris en charge (re-sauvegardez d'abord depuis Word).
- Choisissez la gestion des images avec l'interrupteur du haut : « Strip images » (défaut, le plus rapide, Markdown le plus propre) ou « Embed as base64 » (chaque image devient une URL `data:image/png;base64,...` inline dans le Markdown).
- Cliquez sur Convert. Le serveur dézipe le .docx, parcourt le XML du document et renvoie le Markdown converti plus une liste d'avertissements pour ce qui n'a pas mappé proprement.
- Lisez le panneau d'avertissements en haut. Mammoth liste ce qu'il n'a pas pu convertir : styles non pris en charge, notes de bas de page perdues, commentaires supprimés. Décidez si ça vous gêne.
- Sur le panneau de gauche, vous voyez le Markdown brut. Cliquez sur Copy pour le mettre dans le presse-papiers, ou sur Download pour l'enregistrer en fichier `.md` avec le même nom de base que votre source.
- Sur le panneau de droite, vous voyez l'aperçu HTML rendu depuis le Markdown. C'est ce qu'un moteur Markdown (GitHub, Notion, votre site statique) affichera.
- Si le résultat semble faux, le correctif typique est en amont : dans Word, appliquez de vrais styles de titre (Heading 1, Heading 2) au lieu de juste agrandir la taille de police. Re-sauvegardez, re-déposez.
- Rien n'est stocké. Le fichier est lu dans un buffer, converti, et le buffer est libéré. Aucune copie ne vit sur nos serveurs.
Quand c'est utile
Six situations courantes où cet outil remplace 20 minutes de nettoyage manuel :
- Import d'un long brouillon Word dans un site statique. Vous avez écrit un article de 4000 mots dans Word avec de vrais styles de titre. Vous en avez besoin en Markdown pour Hugo, Astro, MDX Next.js ou Jekyll. Déposez, convertissez, collez, c'est fait. Titres, listes, liens, tableaux : tout est préservé.
- Migration de docs internes de SharePoint ou Google Docs vers un wiki. Votre équipe passe d'une base de connaissances Word à Notion, Obsidian, Outline ou BookStack. Exportez en masse les fichiers Word, faites passer chacun par cet outil, obtenez du Markdown propre prêt à coller.
- Transformer une spec fournisseur en README. Le fournisseur vous a envoyé une spec Word de 30 pages avec titres numérotés et tableaux. Convertissez en Markdown, déposez dans votre repo sous `docs/spec.md`. Cherchable, diffable, en version control.
- Préparation de contenu pour la fenêtre de contexte d'un LLM. Vous voulez nourrir un document Word dans ChatGPT, Claude ou un modèle local. Le Markdown est bien plus efficient en tokens que du Word HTML brut et le modèle parse mieux la structure (titres, listes).
- Citation d'une section dans une issue ou pull request GitHub. Vous avez reçu un fichier Word en rapport de bug. Convertissez, copiez la section pertinente, collez dans l'issue. La structure (la liste d'étapes, le tableau des versions) survit intacte.
- Traduction d'un template de contrat légal. Vous avez l'original en .docx, vous voulez une version Markdown propre pour la passer dans un pipeline de traduction. Convertissez, traduisez le Markdown (où la mise en forme est du texte, pas des métadonnées), puis ré-exportez.