Convierte Word .docx a Markdown limpio, headings, listas y tablas intactos
Tienes un fichero .docx de Word, export de Google Docs o LibreOffice y lo necesitas como Markdown para tu README, sitio estático, blog post o nota Notion / Obsidian. Copia-pegar de Word a un editor Markdown te deja basura: smart quotes, bullet points rotos, sin headings.
Esta herramienta lee la estructura OpenXML dentro de tu .docx (Word es realmente un archivo ZIP con XML dentro), mapea estilos de párrafo a headings Markdown, listas con bullets y numeradas a `-` y `1.`, tablas a tablas GitHub-flavored, y bold / italic / enlaces a sus equivalentes Markdown.
Todo el trabajo corre server-side en nuestro proceso Node usando `mammoth`, la misma librería que usan las herramientas estilo Pandoc por debajo. El fichero se parsea en memoria y se descarta inmediatamente, nunca se escribe a disco, nunca se loguea. Ves dos paneles: el Markdown raw a la izquierda (copia o descarga), y una preview HTML en vivo a la derecha para comprobar el resultado antes de pegarlo en tu repo.
Cómo usarlo
- Suelta tu fichero .docx en el dropzone, o pulsa "Elegir fichero". Solo se acepta `.docx`, el formato binario antiguo `.doc` no está soportado (vuélvelo a guardar desde Word primero).
- Elige la gestión de imágenes con el interruptor de arriba: "Quitar imágenes" (default, más rápido, Markdown más limpio) o "Embeber como base64" (cada imagen se convierte en una URL `data:image/png;base64,...` inline en el Markdown).
- Pulsa Convertir. El servidor descomprime el .docx, recorre el XML del documento y devuelve el Markdown convertido más una lista de avisos para cualquier cosa que no mapeó limpiamente.
- Lee el panel de avisos arriba. Mammoth lista cosas que no pudo convertir: estilos no soportados, footnotes perdidas, comentarios descartados. Decide si te importan.
- En el panel izquierdo ves el Markdown raw. Pulsa Copiar para ponerlo en el portapapeles, o Descargar para guardarlo como fichero `.md` con el mismo nombre base que tu fuente.
- En el panel derecho ves la preview HTML renderizada desde el Markdown. Esto es lo que un motor Markdown (GitHub, Notion, tu sitio estático) mostrará.
- Si el resultado se ve mal, el arreglo habitual es aguas arriba: en Word, aplica estilos de heading reales (Heading 1, Heading 2) en vez de solo subir el tamaño de fuente. Vuelve a guardar, vuelve a soltar.
- No se almacena nada. El fichero se lee en un buffer, se convierte y el buffer se libera. Ninguna copia vive en nuestros servidores.
Cuándo es útil
Seis situaciones comunes en las que esta herramienta reemplaza 20 minutos de limpieza manual:
- Importar un borrador largo de Word a un sitio estático. Escribiste un artículo de 4000 palabras en Word con estilos de heading apropiados. Lo necesitas como Markdown para Hugo, Astro, Next.js MDX o Jekyll. Soltar, convertir, pegar, hecho. Headings, listas, enlaces, tablas, todos preservados.
- Migrar docs internos de SharePoint o Google Docs a un wiki. Tu equipo está moviéndose de una base de conocimiento basada en Word a Notion, Obsidian, Outline o BookStack. Batch-exporta los ficheros Word, pasa cada uno por esta herramienta, obtén Markdown limpio listo para pegar.
- Convertir una spec de vendor a un README. El vendor envió una spec Word de 30 páginas con headings numerados y tablas. Convierte a Markdown, suelta en tu repo como `docs/spec.md`. Searchable, diffable, versionada.
- Preparar contenido para una ventana de contexto LLM. Quieres alimentar un doc Word a ChatGPT, Claude o un modelo local. Markdown es muchísimo más eficiente en tokens que HTML Word raw y el modelo parsea la estructura (headings, listas) mejor.
- Citar una sección en un issue o pull request de GitHub. Recibiste un fichero Word como bug report. Convierte, copia la sección relevante, pega en el issue. La estructura (la lista de pasos del usuario, la tabla de versiones) sobrevive intacta.
- Traducir una plantilla de contrato legal. Tienes el original en .docx, necesitas una versión Markdown limpia para pasar por un pipeline de traducción. Convierte, traduce el Markdown (donde el formato es texto, no metadata), luego re-exporta.