¿Mis headings de Word se preservan? Se ven mal en la salida.

**Solo si usaste estilos de heading reales en Word.** Esta es la causa más común de conversiones "feas". Si hiciste un heading **subiendo el tamaño de fuente a 18 y pulsando Bold**, Word lo registra como "Texto normal en 18pt bold", no como un heading. Mammoth no tiene forma de saber que se suponía que era un Heading 1. **Arréglalo en la fuente**: en Word, pulsa la línea, luego pulsa "Heading 1" en el ribbon de Styles. Igual para Heading 2, 3 y así. Vuelve a guardar, vuelve a soltar el fichero. Ahora el Markdown obtiene los prefixes `#`, `##`, `###` apropiados. Tip pro: activa el **panel Styles** (Alt+Ctrl+Mayús+S en Windows) para ver con qué está etiquetado cada párrafo.

**Sí, las tablas básicas se convierten en tablas pipe Markdown GitHub-flavored** (`| a | b |` con una fila separadora). El texto en cada celda se preserva, más bold / italic / enlaces dentro de celdas. **Lo que no sobrevive**: celdas fusionadas (las tablas Markdown no las soportan, el contenido de la celda aterriza en la primera columna), colores de fondo por celda, bordes custom, texto rotado verticalmente y tablas anidadas (Markdown las prohíbe). Si tu doc Word tiene un layout de tabla complejo, el Markdown será más plano que el original. Para tablas mayormente de texto (una lista de versiones, una matriz de features), el resultado es limpio y usable.

¿Se incluyen las imágenes? ¿Qué hace "embeber como base64"?

**Tienes dos opciones**: - **Quitar imágenes** (default): todas las imágenes se quitan. El Markdown es pequeño, legible, y no hay grandes URLs `data:`. Mejor cuando solo te importa el **contenido de texto**. - **Embeber como base64**: cada imagen embebida se convierte en una referencia inline `![alt](data:image/png;base64,...)`. El Markdown es autocontenido (no se necesitan ficheros externos) pero el fichero crece **muy rápido**, una sola captura puede añadir 200 KB o más. Lo que **no** ofrecemos: extraer imágenes a ficheros separados. Si lo necesitas, ejecuta mammoth localmente con la opción `convertImage` apuntando a un directorio. **Nota**: los gráficos vectoriales (charts, SmartArt) no son extraíbles como imágenes en absoluto, aparecen como avisos en el panel.

¿Y los footnotes, endnotes y comentarios?

**Los footnotes y endnotes se descartan** por defecto. Mammoth los lista en los avisos como "footnotes lost". El texto del footnote existe en un stream XML separado dentro del docx (`footnotes.xml`) y no hay forma limpia de expresarlo en Markdown sin contaminar el flujo. Si los necesitas, el workaround típico es **copiar manualmente el texto del footnote al final del Markdown** bajo un heading "Notas". **Los comentarios** (Review > New Comment en Word) **nunca se llevan**, viven en `comments.xml` y son metadata, no contenido de documento. **Track changes** se aplanan a la **versión aceptada** del texto, no quedan marcadores.

¿Por qué mis "track changes" no son visibles en el Markdown?

Porque **Markdown no tiene concepto de tracked changes.** Cuando mammoth parsea el XML del documento, ve el **texto final aceptado**. Los marcadores de borrado, marcadores de inserción y atribuciones de autor todos viven en elementos ` ` y ` ` que no tienen equivalente Markdown. **Workaround si necesitas los cambios visibles**: en Word, acepta o rechaza todos los cambios primero (Review > Accept All / Reject All) para que el doc esté limpio, luego convierte. O, si necesitas específicamente mostrar **qué cambió**, exporta ambas versiones (antes y después) a Markdown por separado y pásalas por una **herramienta diff** (tenemos una herramienta Text Diff que lo hace).

¿Mis estilos custom de Word sobrevivirán?

**No, solo la estructura, no el styling.** Markdown es un formato de contenido, no de presentación. No le importa si tu Heading 1 es Calibri 24pt azul centrado, solo que es un Heading 1. La conversión quita toda info de fuente, color, alineación, line-height y margen. **Lo que sobrevive**: bold, italic, strikethrough, enlaces, headings (como niveles 1 a 6), listas (con bullet vs numeradas), tablas (como texto), bloques de código. **Lo que no**: fuentes, colores, alineación, indentación, line spacing, colores de tema, estilos de párrafo custom. Si necesitas salida con estilo (PDF, listo para imprimir), Markdown es el formato destino equivocado, usa el docx original.

¿Se honran los saltos de página y de sección?

**No, ambos se ignoran.** Markdown es un **formato de flujo**: la salida renderizada reflows para encajar en cualquier ancho que use el lector, así que no hay concepto de "página". Saltos de página en Word (Ctrl+Enter), saltos de sección, saltos de columna, saltos de línea manuales dentro de párrafos todos se descartan. El texto de la página 1 fluye directo al texto de la página 2 sin separador. **Si quieres un separador visible**, la convención es una regla horizontal (`---` en su propia línea). Puedes hacer search-and-replace para meterlo en el Markdown convertido manualmente si lo necesitas. Para salida paginada, convierte el Markdown de vuelta a PDF después usando **Pandoc**, **Typst** o un generador de sitio estático con CSS de impresión.

¿En qué se diferencia esto de Pandoc?

**Pandoc es el estándar de oro** para conversión de documentos, soporta docenas de formatos de entrada y salida, tiene un sistema potente de templates, puede sacar PDF directamente. Pero **Pandoc es una herramienta CLI que instalas localmente** (no siempre trivial en una máquina Windows corporativa sin derechos admin) y la CLI requiere algo de aprendizaje. **Esta herramienta es basada en navegador, cero instalación, sin línea de comandos**. Por debajo usa **mammoth**, que está más **enfocada** que Pandoc: - Mammoth solo lee .docx, solo saca Markdown o HTML. - Mammoth mantiene la conversión **simple y predecible**: no inventa estructura que no estuviera en la fuente. - Pandoc es **más agresivo** con el formato y puede producir salida sutilmente distinta (líneas en blanco extra, smart quotes, marcadores de lista distintos). **Usa esta herramienta** para conversiones puntuales rápidas y cuando no tengas Pandoc a mano. **Usa Pandoc** para procesamiento en batch, docs complejos con matemáticas, o cuando necesites control fino sobre la salida.

¿Qué tan grande puede ser el fichero .docx que suba?

**El límite práctico es alrededor de 25 MB**, que ya cubre un documento de 500 páginas con imágenes embebidas. El servidor lee el fichero en memoria, descomprime el OpenXML, recorre el árbol del documento y emite Markdown. Para un **doc de 50 páginas mayormente texto**, espera 1-2 segundos. Para un **doc de 200 páginas con capturas**, espera 5-10 segundos. **Lo que más lo ralentiza**: cientos de imágenes embebidas con "embeber como base64" activado (la codificación base64 es ella misma trabajo de CPU). **Rate limit**: 30 conversiones por hora por IP, que es plenty para una sesión normal. Si llegas al límite, espera una hora o procesa en batch localmente con mammoth en tu propia máquina.

Conversor DOCX a Markdown - gratis

Convierte Word .docx a Markdown limpio, headings, listas y tablas intactos

Tienes un fichero .docx de Word, export de Google Docs o LibreOffice y lo necesitas como Markdown para tu README, sitio estático, blog post o nota Notion / Obsidian. Copia-pegar de Word a un editor Markdown te deja basura: smart quotes, bullet points rotos, sin headings.

Esta herramienta lee la estructura OpenXML dentro de tu .docx (Word es realmente un archivo ZIP con XML dentro), mapea estilos de párrafo a headings Markdown, listas con bullets y numeradas a `-` y `1.`, tablas a tablas GitHub-flavored, y bold / italic / enlaces a sus equivalentes Markdown.

Todo el trabajo corre server-side en nuestro proceso Node usando `mammoth`, la misma librería que usan las herramientas estilo Pandoc por debajo. El fichero se parsea en memoria y se descarta inmediatamente, nunca se escribe a disco, nunca se loguea. Ves dos paneles: el Markdown raw a la izquierda (copia o descarga), y una preview HTML en vivo a la derecha para comprobar el resultado antes de pegarlo en tu repo.

Cómo usarlo

Suelta tu fichero .docx en el dropzone, o pulsa "Elegir fichero". Solo se acepta `.docx`, el formato binario antiguo `.doc` no está soportado (vuélvelo a guardar desde Word primero).
Elige la gestión de imágenes con el interruptor de arriba: "Quitar imágenes" (default, más rápido, Markdown más limpio) o "Embeber como base64" (cada imagen se convierte en una URL `data:image/png;base64,...` inline en el Markdown).
Pulsa Convertir. El servidor descomprime el .docx, recorre el XML del documento y devuelve el Markdown convertido más una lista de avisos para cualquier cosa que no mapeó limpiamente.
Lee el panel de avisos arriba. Mammoth lista cosas que no pudo convertir: estilos no soportados, footnotes perdidas, comentarios descartados. Decide si te importan.
En el panel izquierdo ves el Markdown raw. Pulsa Copiar para ponerlo en el portapapeles, o Descargar para guardarlo como fichero `.md` con el mismo nombre base que tu fuente.
En el panel derecho ves la preview HTML renderizada desde el Markdown. Esto es lo que un motor Markdown (GitHub, Notion, tu sitio estático) mostrará.
Si el resultado se ve mal, el arreglo habitual es aguas arriba: en Word, aplica estilos de heading reales (Heading 1, Heading 2) en vez de solo subir el tamaño de fuente. Vuelve a guardar, vuelve a soltar.
No se almacena nada. El fichero se lee en un buffer, se convierte y el buffer se libera. Ninguna copia vive en nuestros servidores.

Cuándo es útil

Seis situaciones comunes en las que esta herramienta reemplaza 20 minutos de limpieza manual:

Importar un borrador largo de Word a un sitio estático. Escribiste un artículo de 4000 palabras en Word con estilos de heading apropiados. Lo necesitas como Markdown para Hugo, Astro, Next.js MDX o Jekyll. Soltar, convertir, pegar, hecho. Headings, listas, enlaces, tablas, todos preservados.
Migrar docs internos de SharePoint o Google Docs a un wiki. Tu equipo está moviéndose de una base de conocimiento basada en Word a Notion, Obsidian, Outline o BookStack. Batch-exporta los ficheros Word, pasa cada uno por esta herramienta, obtén Markdown limpio listo para pegar.
Convertir una spec de vendor a un README. El vendor envió una spec Word de 30 páginas con headings numerados y tablas. Convierte a Markdown, suelta en tu repo como `docs/spec.md`. Searchable, diffable, versionada.
Preparar contenido para una ventana de contexto LLM. Quieres alimentar un doc Word a ChatGPT, Claude o un modelo local. Markdown es muchísimo más eficiente en tokens que HTML Word raw y el modelo parsea la estructura (headings, listas) mejor.
Citar una sección en un issue o pull request de GitHub. Recibiste un fichero Word como bug report. Convierte, copia la sección relevante, pega en el issue. La estructura (la lista de pasos del usuario, la tabla de versiones) sobrevive intacta.
Traducir una plantilla de contrato legal. Tienes el original en .docx, necesitas una versión Markdown limpia para pasar por un pipeline de traducción. Convierte, traduce el Markdown (donde el formato es texto, no metadata), luego re-exporta.

Preguntas y respuestas

Convertido limpiamente: - Headings basados en los estilos de párrafo de Word (Heading 1 → `#`, Heading 2 → `##`, y así hasta `######`). - Listas con bullets y numeradas (incluido listas anidadas, hasta ~6 niveles). - Bold, italic, strikethrough. - Hyperlinks con el texto visible y la URL destino. - Tablas como tablas pipe Markdown GitHub-flavored. - Bloques de código cuando Word aplicó un estilo monoespaciado. Descartado o simplificado: - Footnotes y endnotes: mammoth las marca en la lista de avisos, el texto suele perderse. - Comentarios y track changes: nunca se llevan. - Headers y footers de página: Markdown no tiene equivalente. - Números de página, saltos de página, saltos de sección: Markdown es un formato de flujo, no paginado. - Cuadros de texto, formas, SmartArt embebido: no extraíbles como texto. - Ecuaciones (OMML / MathML): descartadas salvo que tengas un pipeline separado de ecuaciones. Cada descarte aparece en el panel de avisos para que sepas exactamente qué falta.

Convierte Word .docx a Markdown limpio, headings, listas y tablas intactos

Cómo usarlo

Suelta tu fichero .docx en el dropzone, o pulsa "Elegir fichero". Solo se acepta `.docx`, el formato binario antiguo `.doc` no está soportado (vuélvelo a guardar desde Word primero).

Elige la gestión de imágenes con el interruptor de arriba: "Quitar imágenes" (default, más rápido, Markdown más limpio) o "Embeber como base64" (cada imagen se convierte en una URL `data:image/png;base64,...` inline en el Markdown).

Pulsa Convertir. El servidor descomprime el .docx, recorre el XML del documento y devuelve el Markdown convertido más una lista de avisos para cualquier cosa que no mapeó limpiamente.

Lee el panel de avisos arriba. Mammoth lista cosas que no pudo convertir: estilos no soportados, footnotes perdidas, comentarios descartados. Decide si te importan.

En el panel izquierdo ves el Markdown raw. Pulsa Copiar para ponerlo en el portapapeles, o Descargar para guardarlo como fichero `.md` con el mismo nombre base que tu fuente.

En el panel derecho ves la preview HTML renderizada desde el Markdown. Esto es lo que un motor Markdown (GitHub, Notion, tu sitio estático) mostrará.

Si el resultado se ve mal, el arreglo habitual es aguas arriba: en Word, aplica estilos de heading reales (Heading 1, Heading 2) en vez de solo subir el tamaño de fuente. Vuelve a guardar, vuelve a soltar.

No se almacena nada. El fichero se lee en un buffer, se convierte y el buffer se libera. Ninguna copia vive en nuestros servidores.

Cuándo es útil

Seis situaciones comunes en las que esta herramienta reemplaza 20 minutos de limpieza manual:

Importar un borrador largo de Word a un sitio estático. Escribiste un artículo de 4000 palabras en Word con estilos de heading apropiados. Lo necesitas como Markdown para Hugo, Astro, Next.js MDX o Jekyll. Soltar, convertir, pegar, hecho. Headings, listas, enlaces, tablas, todos preservados.
Migrar docs internos de SharePoint o Google Docs a un wiki. Tu equipo está moviéndose de una base de conocimiento basada en Word a Notion, Obsidian, Outline o BookStack. Batch-exporta los ficheros Word, pasa cada uno por esta herramienta, obtén Markdown limpio listo para pegar.
Convertir una spec de vendor a un README. El vendor envió una spec Word de 30 páginas con headings numerados y tablas. Convierte a Markdown, suelta en tu repo como `docs/spec.md`. Searchable, diffable, versionada.
Preparar contenido para una ventana de contexto LLM. Quieres alimentar un doc Word a ChatGPT, Claude o un modelo local. Markdown es muchísimo más eficiente en tokens que HTML Word raw y el modelo parsea la estructura (headings, listas) mejor.
Citar una sección en un issue o pull request de GitHub. Recibiste un fichero Word como bug report. Convierte, copia la sección relevante, pega en el issue. La estructura (la lista de pasos del usuario, la tabla de versiones) sobrevive intacta.
Traducir una plantilla de contrato legal. Tienes el original en .docx, necesitas una versión Markdown limpia para pasar por un pipeline de traducción. Convierte, traduce el Markdown (donde el formato es texto, no metadata), luego re-exporta.

Preguntas y respuestas

Conversor DOCX a Markdown

Suelta tu archivo .docx aquí

Convierte Word .docx a Markdown limpio, headings, listas y tablas intactos

Cómo usarlo

Cuándo es útil

Preguntas y respuestas

Herramientas relacionadas

Extractor de texto de PDF

Conversor HTML / Markdown

XLSX a JSON / CSV

Formateador JSON

Conversor DOCX a Markdown

Suelta tu archivo .docx aquí

Convierte Word .docx a Markdown limpio, headings, listas y tablas intactos

Cómo usarlo

Cuándo es útil

Preguntas y respuestas

Herramientas relacionadas

Extractor de texto de PDF

Conversor HTML / Markdown

XLSX a JSON / CSV

Formateador JSON