Ce que sont les métadonnées PDF et pourquoi elles fuient
Chaque PDF transporte un Info dictionary plus les dates de création et de modification. Word, Acrobat, Chrome et les drivers « Imprimer en PDF » tamponnent tous ces champs automatiquement, généralement avec ton nom complet depuis le profil utilisateur de l'OS, le logiciel de la machine (« Microsoft Word for Microsoft 365 ») et l'horodatage exact de création. La plupart des gens ne voient jamais ces champs et ne les retirent jamais avant d'envoyer le document.
Cet outil dépose un PDF, te montre chaque champ de métadonnée, et te laisse éditer ou effacer chacun. Tu peux renommer « Jean Dupont - acme-corp-laptop » en un propre « Anonyme », effacer la date de création, fixer un titre custom pour le SEO, ou tout retirer pour une ardoise vierge. Puis tu télécharges un nouveau PDF avec seulement les métadonnées que tu as choisies. Tourne à 100 % dans ton navigateur avec pdf-lib : le fichier original ne quitte jamais ton appareil.
Comment l'utiliser
- Dépose un PDF dans la zone d'upload ou clique pour en choisir un sur disque. Le fichier reste dans ton navigateur.
- Vois chaque champ de métadonnée que le PDF transporte : Title, Author, Subject, Keywords, Creator, Producer, plus les dates de création et de modification.
- Édite n'importe quel champ en y tapant. Laisse vide pour retirer ce champ entièrement de la sortie.
- Utilise Tout effacer pour vider chaque champ éditable d'un coup : pratique avant de partager un document publiquement.
- Appuie sur Appliquer pour construire le nouveau PDF, puis Télécharge-le. L'original est intact.
- Pour les workflows sensibles (avocats, journalistes, lanceurs d'alerte), associe ça avec l'extracteur de texte PDF et vérifie que le nouveau fichier ne montre aucune trace de ton identité.
Quand c'est utile
Six raisons du quotidien d'éditer ou retirer les métadonnées PDF :
- Vie privée personnelle avant partage : un PDF que tu produis montre ton vrai nom dans le champ Author par défaut. Le retirer avant de poster sur un forum, Reddit ou un partage de fichier public garde ton identité privée.
- Protection des sources pour journalistes et lanceurs d'alerte : un document fuité porte des traces de l'appareil sur lequel il a été créé. Un Author et un Producer propres rendent l'attribution plus difficile.
- SEO et accessibilité : les moteurs de recherche indexent les champs Title et Subject. Un titre descriptif bat « Document1.docx » dans l'aperçu Google.
- Cohérence de marque : les livrables clients devraient dire « Acme Studio - Rapport T1 » plutôt que « Portable de Jean - Sans titre ».
- Conformité et pistes d'audit : les industries régulées (juridique, médical, finance) exigent parfois des motifs de métadonnées spécifiques. C'est un moyen rapide de les régler.
- Corriger de mauvais défauts : un PDF qui porte « Microsoft Word 2019 » comme Creator a l'air peu pro quand ton cabinet vend des « workflows de contenu AI-first ». Efface ou réécris.
Outils compagnons : extracteur de texte PDF, numéros de pages PDF, filigrane PDF.