Jak wyciągnąć tekst z obrazu (OCR)?
OCR obrazu czyta tekst na zdjęciu, zrzucie ekranu lub skanie i zwraca zwykły ciąg znaków, który możesz skopiować, wkleić albo przeszukać.
Wrzuć JPG, PNG lub WebP (do 10 MB), wybierz język, dostajesz rozpoznany tekst z procentem pewności dla każdego bloku.
Rozpoznawanie działa na naszym serwerze za pomocą Tesseract - silnika, który napędza Google Android - z paczkami angielską, polską, niemiecką, francuską i hiszpańską.
Najlepiej działa na czystych skanach, zrzutach ekranów, fakturach, paragonach i wydrukowanych stronach. Pismo odręczne i tła zaszumione poradzi sobie słabo.
Jak używać
- Przeciągnij obraz na dropzonę albo kliknij "Wybierz plik" - przyjmujemy JPG, PNG, WebP. HEIC nie, najpierw przekonwertuj go w konwerterze HEIC.
- Wybierz język zgodny z obrazem. Mieszanie języków na jednej stronie działa kiepsko - użyj dominującego.
- Kliknij "Wyciągnij tekst". Pierwsze uruchomienie pobiera ~10 MB paczki językowej na serwerze, więc pierwsze wywołanie może trwać 5 do 15 sekund. Kolejne idą szybciej.
- Przeczytaj wyciągnięty tekst w polu po prawej. "Kopiuj" wrzuca go do schowka, "Pobierz" zapisuje plik `.txt`.
- Włącz "Pokaż ramki słów", żeby zobaczyć każde rozpoznane słowo na obrazie - przydaje się do wyłapywania pominiętych fragmentów albo miejsc o niskiej pewności.
Kiedy się przydaje
Gdzie OCR oszczędza czas - typowe sytuacje:
- Cytat ze zrzutu ekranu w dokumencie albo czacie bez przepisywania słowo po słowie.
- Wyciągnięcie telefonu, maila lub adresu ze zdjęcia wizytówki albo wydrukowanej ulotki.
- Czytanie paragonu żeby spisać wydatek - pozycje i kwoty stają się szukalnym tekstem.
- Tekst z UI, gdy programista albo projektant wysyła Ci płaski PNG bez edytowalnej warstwy.
- Stare faktury i umowy, które kiedyś zeskanowano do PDF i straciły warstwę tekstową po drodze.
- Memy, znaki, plakaty - szybki sposób, żeby chwycić hasło albo podpis.
Jeśli Twój plik to PDF z warstwą tekstową (większość PDFów z Worda, Pages, Chrome "Zapisz jako PDF" ma ją), użyj zamiast tego ekstraktora tekstu z PDF - działa natychmiast, jest dokładny i bez błędów OCR. OCR ma sens tylko gdy w pliku nie ma prawdziwego tekstu, tylko piksele.