Konwersja Word .docx do czystego Markdown z zachowaniem nagłówków, list i tabel
Masz plik .docx z Worda, eksport z Google Docs albo LibreOffice i potrzebujesz go w Markdown do README, strony statycznej, wpisu na blogu albo notatki w Notion / Obsidian. Kopiuj-wklej z Worda do edytora Markdown daje śmieci: krzywe cudzysłowy, popsute listy, brak nagłówków.
Ten tool czyta strukturę OpenXML wewnątrz .docx (Word to tak naprawdę archiwum ZIP z plikami XML w środku), mapuje style akapitów Worda na nagłówki Markdown, listy punktowane i numerowane na `-` i `1.`, tabele na tabele w stylu GitHub, a bold / italic / linki na ich odpowiedniki w Markdown.
Cała robota dzieje się po stronie serwera w procesie Node z użyciem biblioteki `mammoth` (tej samej, którą wykorzystują toole typu Pandoc). Plik parsujemy w pamięci i od razu wyrzucamy, niczego nie zapisujemy na dysk, niczego nie logujemy. Widzisz dwa panele: surowy Markdown po lewej (kopiuj albo pobierz) i podgląd HTML po prawej, żebyś mógł sprawdzić wynik zanim wkleisz go do repo.
Jak używać
- Upuść plik .docx na obszar dropzone albo kliknij "Wybierz plik". Akceptujemy tylko `.docx`, stary binarny format `.doc` nie jest obsługiwany (zapisz w Wordzie jako .docx i wróć).
- Wybierz tryb obsługi obrazków przełącznikiem u góry: "Usuń obrazki" (domyślnie, najszybciej, najczystszy Markdown) albo "Osadź jako base64" (każdy obrazek staje się inline URL `data:image/png;base64,...`).
- Kliknij Konwertuj. Serwer rozpakuje .docx, przejdzie po drzewie XML i zwróci Markdown plus listę ostrzeżeń o tym, czego nie udało się czysto przekonwertować.
- Przeczytaj panel ostrzeżeń u góry. Mammoth wypisuje rzeczy, których nie zamienił: nieobsługiwane style, zgubione przypisy, ucięte komentarze. Decydujesz, czy Ci to przeszkadza.
- Po lewej stronie widzisz surowy Markdown. Kliknij Kopiuj, żeby wrzucić do schowka, albo Pobierz, żeby zapisać jako plik `.md` z tą samą nazwą bazową co plik źródłowy.
- Po prawej stronie widzisz podgląd HTML wyrenderowany z Markdown. To jest dokładnie to, co wyświetli silnik Markdown (GitHub, Notion, generator stron statycznych).
- Jeśli wynik wygląda źle, prawie zawsze poprawka leży po stronie pliku źródłowego: w Wordzie stosuj prawdziwe style nagłówków (Nagłówek 1, Nagłówek 2), a nie tylko zwiększaj rozmiar czcionki. Zapisz, upuść jeszcze raz.
- Niczego nie przechowujemy. Plik wczytujemy do bufora, konwertujemy, bufor zwalniamy. Żadna kopia nie zostaje na naszych serwerach.
Kiedy się przydaje
Sześć typowych sytuacji, w których ten tool oszczędza 20 minut ręcznego sprzątania:
- Import długiego draftu z Worda do strony statycznej. Napisałeś 4000-słowny artykuł w Wordzie z prawdziwymi stylami nagłówków. Potrzebujesz Markdown do Hugo, Astro, Next.js MDX albo Jekyll. Upuść, konwertuj, wklej, gotowe. Nagłówki, listy, linki, tabele, wszystko zachowane.
- Migracja dokumentacji wewnętrznej z SharePoint albo Google Docs do wiki. Zespół przenosi bazę wiedzy z Worda do Notion, Obsidian, Outline albo BookStack. Eksportujesz wszystkie pliki Worda paczką, każdy przepuszczasz przez ten tool, dostajesz czysty Markdown gotowy do wklejenia.
- Zamiana specyfikacji od dostawcy na README. Dostawca przysłał 30-stronicową specyfikację w Wordzie z numerowanymi nagłówkami i tabelami. Konwertujesz do Markdown, wrzucasz do repo jako `docs/spec.md`. Wyszukiwalne, diffowalne, pod kontrolą wersji.
- Przygotowanie treści do kontekstu LLM. Chcesz wrzucić dokument Worda do ChatGPT, Claude albo lokalnego modelu. Markdown jest dużo bardziej oszczędny tokenowo niż surowy HTML z Worda, a model lepiej rozumie strukturę (nagłówki, listy).
- Cytowanie fragmentu w issue albo pull requeście na GitHubie. Dostałeś plik Worda jako zgłoszenie buga. Konwertujesz, kopiujesz odpowiedni fragment, wklejasz do issue. Struktura (lista kroków użytkownika, tabela wersji) zostaje nienaruszona.
- Tłumaczenie szablonu umowy. Masz oryginał w .docx, potrzebujesz czystej wersji Markdown do potoku tłumaczeń. Konwertujesz, tłumaczysz Markdown (gdzie formatowanie jest tekstem, nie metadanymi), potem reeksportujesz.