Bleiben meine Word-Headings erhalten? Sie sehen falsch aus im Output.

**Nur wenn du in Word echte Heading-Styles genutzt hast.** Das ist die häufigste Ursache für "hässliche" Konvertierungen. Hast du eine Überschrift gemacht, indem du **die Schriftgröße auf 18 gehoben und Fett geklickt** hast, speichert Word das als "Normaler Text in 18pt fett", nicht als Heading. Mammoth hat keine Möglichkeit zu wissen, dass das eine Heading 1 sein sollte. **Fix an der Quelle**: in Word die Zeile klicken, dann "Heading 1" im Styles-Band klicken. Genauso für Heading 2, 3 etc. Neu speichern, neu droppen. Jetzt kriegt das Markdown korrekte `#`-, `##`-, `###`-Präfixe. Profi-Tipp: **Styles-Pane** anschalten (Alt+Strg+Shift+S unter Windows), damit du siehst, wie jeder Absatz getaggt ist.

Kommen Tabellen durch?

**Ja, einfache Tabellen werden zu GitHub-Flavored-Markdown-Pipe-Tabellen** (`| a | b |` mit Trennzeile). Der Text in jeder Zelle bleibt, plus fett / kursiv / Links in Zellen. **Was nicht überlebt**: gemergte Zellen (Markdown-Tabellen können das nicht, der Zellinhalt landet in der ersten Spalte), Per-Zelle-Background-Farben, eigene Rahmen, vertikal gedrehter Text, verschachtelte Tabellen (Markdown verbietet das). Hat dein Word-Doc ein komplexes Tabellen-Layout, ist das Markdown flacher als das Original. Für überwiegend Text-Tabellen (Versionsliste, Feature-Matrix) ist das Ergebnis sauber und brauchbar.

Werden Bilder eingebunden? Was macht "als base64 einbetten"?

**Du hast zwei Optionen**: - **Bilder strippen** (Default): alle Bilder werden entfernt. Das Markdown ist klein, lesbar, ohne große `data:`-URLs. Am besten, wenn du nur den **Text-Inhalt** brauchst. - **Als base64 einbetten**: jedes eingebettete Bild wird zu einer `![alt](data:image/png;base64,...)`-Inline-Referenz. Das Markdown ist self-contained (keine externen Dateien nötig), aber das File wird **schnell groß**, ein einzelner Screenshot kann 200 KB oder mehr ergänzen. Was wir **nicht** bieten: Bilder in separate Dateien extrahieren. Brauchst du das, lass mammoth lokal mit der `convertImage`-Option auf ein Verzeichnis laufen. **Hinweis**: Vektorgrafiken (Charts, SmartArt) sind überhaupt nicht als Bilder extrahierbar, sie erscheinen als Warnungen im Panel.

Was ist mit Fußnoten, Endnoten und Kommentaren?

**Fußnoten und Endnoten werden gedroppt** per Default. Mammoth listet sie als "footnotes lost" in den Warnungen. Der Fußnoten-Text lebt in einem separaten XML-Stream in der docx (`footnotes.xml`), und es gibt keinen sauberen Weg, das in Markdown auszudrücken, ohne den Flow zu vermüllen. Brauchst du sie, ist der typische Workaround, **Fußnoten-Text manuell ans Ende des Markdowns** unter eine "Notes"-Überschrift zu kopieren. **Kommentare** (Review > Neuer Kommentar in Word) werden **nie übertragen**, sie leben in `comments.xml` und sind Metadaten, kein Dokument-Inhalt. **Track-Changes** werden auf die **akzeptierte Version** des Textes geflattet, keine Marker bleiben.

Warum sind meine "Track-Changes" im Markdown nicht sichtbar?

Weil **Markdown kein Konzept von Track-Changes hat.** Wenn mammoth das Dokument-XML parst, sieht es den **finalen akzeptierten Text**. Löschungs-Marker, Insertion-Marker und Author-Attributionen leben alle in ` `- und ` `-Elementen, die keinen Markdown-Pendant haben. **Workaround, wenn du die Änderungen sichtbar brauchst**: in Word zuerst alle Änderungen annehmen oder ablehnen (Review > Alle annehmen / ablehnen), damit das Doc sauber ist, dann konvertieren. Oder, brauchst du speziell **was sich geändert hat**, exportier beide Versionen (vor und nach) separat zu Markdown und jag sie durch ein **Diff-Tool** (wir haben ein Text-Diff-Tool dafür).

Überleben meine Custom-Word-Styles?

**Nein, nur die Struktur, nicht das Styling.** Markdown ist ein Content-Format, kein Presentation-Format. Es interessiert nicht, ob deine Heading 1 Calibri 24pt blau zentriert ist, nur dass es eine Heading 1 ist. Die Konvertierung strippt alle Font-, Farb-, Alignment-, Line-Height- und Margin-Infos. **Was überlebt**: fett, kursiv, durchgestrichen, Links, Headings (Level 1 bis 6), Listen (Bullets vs nummeriert), Tabellen (als Text), Code-Blöcke. **Was nicht**: Fonts, Farben, Alignment, Indentation, Line-Spacing, Theme-Farben, Custom-Absatz-Styles. Brauchst du gestylten Output (PDF, Print-Ready), ist Markdown das falsche Ziel, nimm das originale docx.

Werden Seitenumbrüche und Sektionsumbrüche ehrt?

**Nein, beide werden ignoriert.** Markdown ist ein **Flow-Format**: der gerenderte Output fließt neu, um in jede Breite zu passen, also gibt es kein Konzept einer "Seite". Seitenumbrüche in Word (Strg+Enter), Sektionsumbrüche, Spaltenumbrüche, manuelle Zeilenumbrüche in Absätzen sind alle weg. Der Text von Seite 1 fließt direkt in den von Seite 2 ohne Trenner. **Willst du einen sichtbaren Trenner**, ist die Konvention eine Horizontal-Linie (`---` auf eigener Zeile). Du kannst das manuell ins konvertierte Markdown search-and-replacen. Für paginierten Output das Markdown nachher zurück zu PDF konvertieren via **Pandoc**, **Typst** oder einen Static-Site-Generator mit Print-CSS.

Wie unterscheidet sich das von Pandoc?

**Pandoc ist der Goldstandard** für Dokument-Konvertierung, unterstützt Dutzende Input- und Output-Formate, hat ein mächtiges Template-System, kann PDF direkt ausgeben. Aber **Pandoc ist ein Command-Line-Tool, das du lokal installierst** (auf einer Corporate-Windows-Kiste ohne Admin-Rechte nicht immer trivial), und die CLI braucht etwas Einarbeitung. **Dieses Tool ist browser-basiert, null Installation, keine Command-Line**. Drunter nutzt es **mammoth**, das **enger fokussiert** ist als Pandoc: - Mammoth liest nur .docx, gibt nur Markdown oder HTML aus. - Mammoth hält die Konvertierung **einfach und vorhersehbar**: es erfindet keine Struktur, die nicht in der Quelle war. - Pandoc ist **aggressiver** beim Formatieren und kann subtil anderen Output erzeugen (extra Leerzeilen, Smart-Quotes, andere List-Marker). **Nimm dieses Tool** für schnelle Einmal-Konvertierungen und wenn Pandoc nicht zur Hand ist. **Nimm Pandoc** für Batch-Processing, komplexe Docs mit Mathe oder wenn du feingranulare Kontrolle über den Output brauchst.

Wie groß darf eine .docx sein?

**Praktisches Limit liegt bei etwa 25 MB**, das deckt schon ein 500-Seiten-Dokument mit eingebetteten Bildern. Der Server liest das File in den Speicher, entpackt das OpenXML, wandert den Dokument-Tree, emittet Markdown. Für ein **text-lastiges 50-Seiten-Doc** rechne 1 bis 2 Sekunden. Für ein **200-Seiten-Doc mit Screenshots** 5 bis 10 Sekunden. **Was es am meisten verlangsamt**: hunderte eingebettete Bilder mit "als base64 einbetten" an (die base64-Kodierung ist selbst CPU-Arbeit). **Rate-Limit**: 30 Konvertierungen pro Stunde pro IP, reicht für eine normale Session. Triffst du das Limit, eine Stunde warten oder lokal mit mammoth batch-prozessieren.

DOCX zu Markdown - kostenlos

Word .docx in sauberes Markdown konvertieren, Headings, Listen und Tabellen intakt

Du hast eine .docx-Datei aus Word, Google-Docs-Export oder LibreOffice und brauchst sie als Markdown für dein README, eine statische Seite, einen Blog-Post oder eine Notion-/Obsidian-Notiz. Aus Word in einen Markdown-Editor zu copy-pasten gibt dir Müll: Smart-Quotes, kaputte Bullets, keine Headings.

Dieses Tool liest die OpenXML-Struktur in deiner .docx (Word ist eigentlich ein ZIP-Archiv mit XML drin), mappt Absatz-Styles auf Markdown-Headings, Aufzählungen und nummerierte Listen auf `-` und `1.`, Tabellen auf GitHub-Flavored-Tables und fett / kursiv / Links auf ihre Markdown-Äquivalente.

Der ganze Job läuft serverseitig in unserem Node-Prozess mit `mammoth`, derselben Library, die Pandoc-artige Tools drunter nutzen. Die Datei wird im Speicher geparst und sofort verworfen, nie auf die Disk geschrieben, nie geloggt. Du siehst zwei Panes: das rohe Markdown links (kopieren oder runterladen) und eine Live-HTML-Vorschau rechts, damit du das Ergebnis vor dem Pasten in dein Repo prüfen kannst.

So nutzt du das Tool

Deine .docx-Datei in die Dropzone ziehen oder "Datei wählen" klicken. Nur `.docx` wird akzeptiert, das ältere `.doc`-Binärformat nicht (vorher in Word neu speichern).
Image-Handling wählen mit dem Switch oben: "Bilder strippen" (Default, schnellste, sauberste Markdown) oder "Als base64 einbetten" (jedes Bild wird zu einer `data:image/png;base64,...`-URL inline im Markdown).
Convert drücken. Der Server entpackt die .docx, wandert das Dokument-XML und liefert das konvertierte Markdown plus eine Warnungsliste für alles, was nicht sauber gemappt hat.
Die Warnungs-Panel oben lesen. Mammoth listet Dinge, die es nicht konvertieren konnte: nicht unterstützte Styles, verlorene Fußnoten, gedroppte Kommentare. Entscheiden, ob es dich kümmert.
Im linken Pane siehst du das rohe Markdown. Copy ins Clipboard oder Download, um es als `.md`-Datei mit dem gleichen Basisnamen wie die Quelle zu speichern.
Im rechten Pane siehst du die HTML-Vorschau aus dem Markdown gerendert. So zeigt es eine Markdown-Engine (GitHub, Notion, deine statische Seite).
Sieht das Ergebnis falsch aus, ist der Fix meist upstream: in Word echte Heading-Styles anwenden (Heading 1, Heading 2) statt nur die Schriftgröße zu bumpen. Neu speichern, neu droppen.
Nichts wird gespeichert. Die Datei wird in einen Buffer gelesen, konvertiert, der Buffer freigegeben. Keine Kopie lebt auf unseren Servern.

Wann das nützlich ist

Sechs gängige Situationen, in denen das Tool 20 Minuten manuelles Aufräumen ersetzt:

Langen Word-Entwurf in eine statische Seite importieren. Du hast einen 4000-Wort-Artikel in Word mit echten Heading-Styles. Du brauchst ihn als Markdown für Hugo, Astro, Next.js MDX oder Jekyll. Droppen, konvertieren, pasten, fertig. Headings, Listen, Links, Tabellen, alles erhalten.
Interne Docs von SharePoint oder Google Docs in ein Wiki migrieren. Dein Team zieht von einer Word-basierten Knowledge-Base zu Notion, Obsidian, Outline oder BookStack. Word-Files batch-exportieren, jede durchs Tool jagen, sauberes Markdown zum Pasten kriegen.
Eine Vendor-Spec zu einer README machen. Der Vendor hat dir eine 30-Seiten-Word-Spec mit nummerierten Headings und Tabellen geschickt. Zu Markdown konvertieren, in dein Repo als `docs/spec.md` droppen. Suchbar, diffbar, versionskontrolliert.
Content fürs LLM-Context-Window vorbereiten. Du willst ein Word-Doc in ChatGPT, Claude oder ein lokales Modell stecken. Markdown ist deutlich token-effizienter als rohes Word-HTML, und das Modell parst Struktur (Headings, Listen) besser.
Eine Section in einem GitHub-Issue oder PR zitieren. Du hast eine Word-Datei als Bug-Report bekommen. Konvertieren, die relevante Section kopieren, in das Issue pasten. Die Struktur (User-Step-Liste, Versions-Tabelle) überlebt intakt.
Ein juristisches Vertrags-Template übersetzen. Du hast das Original als .docx und brauchst eine saubere Markdown-Version für eine Translation-Pipeline. Konvertieren, das Markdown übersetzen (wo Formatierung Text ist, nicht Metadaten), dann zurück exportieren.

Fragen und Antworten

Sauber konvertiert: - Headings anhand der Absatz-Styles in Word (Heading 1 -> `#`, Heading 2 -> `##` usw. bis `######`). - Aufzählungen und nummerierte Listen (inkl. verschachtelter Listen, bis ~6 Ebenen). - Fett, kursiv, durchgestrichen. - Hyperlinks mit sichtbarem Text und Ziel-URL. - Tabellen als GitHub-Flavored-Markdown-Pipe-Tabellen. - Code-Blöcke, wenn Word einen Monospace-Style angewendet hat. Gedroppt oder simplifiziert: - Fußnoten und Endnoten: mammoth flaggt das in den Warnungen, der Text ist meist weg. - Kommentare und Track-Changes: nicht übertragen. - Seiten-Header und -Footer: Markdown hat kein Äquivalent. - Seitennummern, Seitenumbrüche, Sektionsumbrüche: Markdown ist Flow-Format, nicht paginiert. - Textboxen, Shapes, eingebetteter SmartArt: nicht als Text extrahierbar. - Formeln (OMML / MathML): gedroppt, außer du hast eine separate Formel-Pipeline. Jeder Drop erscheint im Warnungs-Panel, sodass du genau weißt, was fehlt.

Word .docx in sauberes Markdown konvertieren, Headings, Listen und Tabellen intakt

So nutzt du das Tool

Deine .docx-Datei in die Dropzone ziehen oder "Datei wählen" klicken. Nur `.docx` wird akzeptiert, das ältere `.doc`-Binärformat nicht (vorher in Word neu speichern).

Image-Handling wählen mit dem Switch oben: "Bilder strippen" (Default, schnellste, sauberste Markdown) oder "Als base64 einbetten" (jedes Bild wird zu einer `data:image/png;base64,...`-URL inline im Markdown).

Convert drücken. Der Server entpackt die .docx, wandert das Dokument-XML und liefert das konvertierte Markdown plus eine Warnungsliste für alles, was nicht sauber gemappt hat.

Die Warnungs-Panel oben lesen. Mammoth listet Dinge, die es nicht konvertieren konnte: nicht unterstützte Styles, verlorene Fußnoten, gedroppte Kommentare. Entscheiden, ob es dich kümmert.

Im linken Pane siehst du das rohe Markdown. Copy ins Clipboard oder Download, um es als `.md`-Datei mit dem gleichen Basisnamen wie die Quelle zu speichern.

Im rechten Pane siehst du die HTML-Vorschau aus dem Markdown gerendert. So zeigt es eine Markdown-Engine (GitHub, Notion, deine statische Seite).

Sieht das Ergebnis falsch aus, ist der Fix meist upstream: in Word echte Heading-Styles anwenden (Heading 1, Heading 2) statt nur die Schriftgröße zu bumpen. Neu speichern, neu droppen.

Nichts wird gespeichert. Die Datei wird in einen Buffer gelesen, konvertiert, der Buffer freigegeben. Keine Kopie lebt auf unseren Servern.

Wann das nützlich ist

Sechs gängige Situationen, in denen das Tool 20 Minuten manuelles Aufräumen ersetzt:

Langen Word-Entwurf in eine statische Seite importieren. Du hast einen 4000-Wort-Artikel in Word mit echten Heading-Styles. Du brauchst ihn als Markdown für Hugo, Astro, Next.js MDX oder Jekyll. Droppen, konvertieren, pasten, fertig. Headings, Listen, Links, Tabellen, alles erhalten.
Interne Docs von SharePoint oder Google Docs in ein Wiki migrieren. Dein Team zieht von einer Word-basierten Knowledge-Base zu Notion, Obsidian, Outline oder BookStack. Word-Files batch-exportieren, jede durchs Tool jagen, sauberes Markdown zum Pasten kriegen.
Eine Vendor-Spec zu einer README machen. Der Vendor hat dir eine 30-Seiten-Word-Spec mit nummerierten Headings und Tabellen geschickt. Zu Markdown konvertieren, in dein Repo als `docs/spec.md` droppen. Suchbar, diffbar, versionskontrolliert.
Content fürs LLM-Context-Window vorbereiten. Du willst ein Word-Doc in ChatGPT, Claude oder ein lokales Modell stecken. Markdown ist deutlich token-effizienter als rohes Word-HTML, und das Modell parst Struktur (Headings, Listen) besser.
Eine Section in einem GitHub-Issue oder PR zitieren. Du hast eine Word-Datei als Bug-Report bekommen. Konvertieren, die relevante Section kopieren, in das Issue pasten. Die Struktur (User-Step-Liste, Versions-Tabelle) überlebt intakt.
Ein juristisches Vertrags-Template übersetzen. Du hast das Original als .docx und brauchst eine saubere Markdown-Version für eine Translation-Pipeline. Konvertieren, das Markdown übersetzen (wo Formatierung Text ist, nicht Metadaten), dann zurück exportieren.

Fragen und Antworten

DOCX zu Markdown

Lege deine .docx-Datei hier ab

Word .docx in sauberes Markdown konvertieren, Headings, Listen und Tabellen intakt

So nutzt du das Tool

Wann das nützlich ist

Fragen und Antworten

Passende Tools

PDF-Text-Extractor

HTML / Markdown Konverter

XLSX zu JSON / CSV Konverter

JSON-Formatter

DOCX zu Markdown

Lege deine .docx-Datei hier ab

Word .docx in sauberes Markdown konvertieren, Headings, Listen und Tabellen intakt

So nutzt du das Tool

Wann das nützlich ist

Fragen und Antworten

Passende Tools

PDF-Text-Extractor

HTML / Markdown Konverter

XLSX zu JSON / CSV Konverter

JSON-Formatter