Qué son los metadatos de un PDF y por qué se filtran
Cada PDF lleva un diccionario Info más fechas de creación y modificación. Word, Acrobat, Chrome y los drivers de "Imprimir a PDF" estampan estos campos automáticamente, normalmente con tu nombre completo del perfil de usuario del SO, el software del equipo ("Microsoft Word para Microsoft 365") y la marca temporal exacta de creación. La mayoría de la gente nunca ve estos campos ni los elimina antes de enviar el documento.
Esta herramienta acepta un PDF, te muestra cada campo de metadatos y te deja editar o borrar cada uno. Puedes renombrar "Juan Pérez - portátil-acme" como un limpio "Anónimo", borrar la fecha de creación, fijar un título personalizado por SEO, o limpiarlo todo a una página en blanco. Luego descargas un PDF nuevo con solo los metadatos que tú elegiste. Se ejecuta 100% en tu navegador con pdf-lib: el archivo original no sale de tu dispositivo.
Cómo usarlo
- Suelta un PDF en la zona de subida o pulsa para elegirlo del disco. El archivo se queda en tu navegador.
- Ve todos los campos de metadatos que lleva el PDF: Title, Author, Subject, Keywords, Creator, Producer, más fechas de creación y modificación.
- Edita cualquier campo escribiendo en él. Déjalo vacío para eliminar ese campo por completo de la salida.
- Usa Limpiar todo para borrar todos los campos editables a la vez: práctico antes de compartir un documento públicamente.
- Pulsa Aplicar para construir el PDF nuevo y luego Descárgalo. El original queda intacto.
- Para flujos sensibles (abogados, periodistas, whistleblowers), combina esto con el extractor de texto de PDF y verifica que el nuevo archivo no muestra rastros de tu identidad.
Cuándo es útil
Seis motivos del día a día para editar o eliminar metadatos de PDF:
- Privacidad personal antes de compartir: un PDF que produces muestra tu nombre real en el campo Author por defecto. Eliminarlo antes de publicar en un foro, Reddit o un file share público mantiene tu identidad privada.
- Protección de fuentes para periodistas y whistleblowers: un documento filtrado lleva rastros del dispositivo en el que se creó. Author y Producer limpios dificultan la atribución.
- SEO y accesibilidad: los buscadores indexan los campos Title y Subject. Un título descriptivo gana a "Documento1.docx" en el preview de Google.
- Consistencia de marca: los entregables a clientes deberían decir "Acme Studio - Informe Q1" en vez de "Portátil de Juan - Sin título".
- Compliance y trazabilidad: industrias reguladas (legal, médica, financiera) a veces requieren patrones específicos de metadatos. Esta es una forma rápida de fijarlos.
- Arreglar predeterminados incorrectos: un PDF con "Microsoft Word 2019" como Creator parece poco profesional cuando tu firma vende "flujos de contenido con IA". Limpia o reescribe.
Herramientas complementarias: extractor de texto de PDF, números de página de PDF, marca de agua PDF.