Czym są metadane PDF i jak wyciekają
Każdy PDF nosi w sobie słownik Info plus daty utworzenia i modyfikacji. Word, Acrobat, Chrome i sterowniki "Drukuj do PDF" stemplują te pola automatycznie - zwykle Twoim pełnym imieniem i nazwiskiem z profilu systemu, softem maszyny ("Microsoft Word for Microsoft 365") i dokładnym czasem utworzenia. Większość ludzi nigdy nie zagląda do tych pól i nie czyści ich przed wysłaniem dokumentu.
To narzędzie przyjmuje PDF, pokazuje wszystkie pola metadanych i pozwala edytować lub wymazać każde z nich. Możesz zmienić "Jan Kowalski - acme-corp-laptop" na czyste "Anonymous", wyzerować datę utworzenia, ustawić niestandardowy tytuł pod SEO albo skasować wszystko do pustego stanu. Potem pobierasz nowy PDF z tylko tymi metadanymi, które wybrałeś. Działa w 100% w przeglądarce dzięki pdf-lib - oryginalny plik nie opuszcza urządzenia.
Jak tego użyć
- Upuść PDF na obszar wgrywania albo kliknij, żeby wybrać z dysku. Plik zostaje w przeglądarce.
- Zobacz wszystkie pola metadanych: Title, Author, Subject, Keywords, Creator, Producer plus daty utworzenia i modyfikacji.
- Edytuj dowolne pole, wpisując w nie tekst. Zostaw puste, żeby usunąć to pole z wynikowego pliku.
- Użyj Wyczyść wszystko, żeby jednym kliknięciem skasować każde edytowalne pole - szybki sposób przed udostępnieniem dokumentu publicznie.
- Naciśnij Zastosuj, żeby zbudować nowy PDF, i potem Pobierz. Oryginał nie jest zmieniany.
- Do wrażliwych zastosowań (prawnicy, dziennikarze, sygnaliści) sparuj to z Ekstrakcją tekstu PDF i sprawdź, że nowy plik nie pokazuje śladów Twojej tożsamości.
Kiedy się przydaje
Sześć codziennych powodów, żeby edytować lub wyzerować metadane:
- Prywatność przed udostępnieniem: domyślnie PDF, który produkujesz, pokazuje Twoje prawdziwe imię i nazwisko w polu Author. Wyczyszczenie tego przed wrzuceniem na forum, Reddita czy publiczny share trzyma tożsamość w prywacie.
- Ochrona źródeł dla dziennikarzy i sygnalistów: wyciekły dokument nosi ślady urządzenia, na którym powstał. Czysty Author i Producer utrudniają atrybucję.
- SEO i dostępność: wyszukiwarki indeksują pola Title i Subject. Opisowy tytuł bije "Document1.docx" w podglądzie Google.
- Spójność marki: pliki przekazywane klientom powinny pisać "Acme Studio - Raport Q1", a nie "Laptop Jasia - Untitled".
- Compliance i audyt: branże regulowane (prawo, medycyna, finanse) czasem wymagają konkretnych wzorców metadanych. To szybki sposób, żeby je ustawić.
- Naprawa złych domyślnych wartości: PDF z "Microsoft Word 2019" jako Creator wygląda nieprofesjonalnie, gdy Twoja firma sprzedaje "AI-first content workflows". Wyczyść albo nadpisz.
Powiązane narzędzia: Ekstrakcja tekstu PDF, Numery stron PDF, Znak wodny PDF.