Kiedy OCR działa dobrze, a kiedy zawodzi?

**Działa dobrze**: czyste skany od 300 DPI w górę, zrzuty ekranów z tekstem cyfrowym, wydrukowane strony, faktury i paragony w standardowych fontach, biały tył z ciemnym tekstem. **Zawodzi lub się męczy**: **pismo odręczne** (Tesseract jest trenowany na druku, nie kursywie), **zaszumione tła** (tekst na zdjęciu), **niska rozdzielczość** (poniżej ~150 px wysokości linii), **przekrzywiony lub zakrzywiony tekst**, **stylizowane fonty**, **odbicia światła** na oryginale. Jeśli człowiek odczyta to w pół sekundy, Tesseract prawdopodobnie też. Jeśli musisz mrużyć oczy, spodziewaj się błędów.

Jakie języki są obsługiwane?

Mamy pięć paczek językowych: **angielski (eng)**, **polski (pol)**, **niemiecki (deu)**, **francuski (fra)** i **hiszpański (spa)**. Sam Tesseract obsługuje **ponad 100 języków**, w tym pisma niełacińskie (arabski, chiński, hindi, cyrylica), więc jeśli potrzebujesz innego, zgłoś nam i włączymy paczkę. **Wybierz język zgodny z obrazem** - OCR polski na stronie angielskiej daje bełkot i odwrotnie.

Jak poprawić jakość wyniku? Czy warto coś zrobić z obrazem przed?

**Przytnij ciasno** wokół tekstu - niepotrzebne obszary tylko mylą silnik. **Zwiększ kontrast**, jeśli obraz jest wyblakły (szybkie "auto poziomy" w dowolnej apce pomaga). **Wyprostuj**, jeśli strona jest przekrzywiona o więcej niż kilka stopni - proste poziome linie działają najlepiej. **Unikaj artefaktów JPEG** na tekście: zapisz źródło jako PNG, jeśli możesz. **Cel to ~300 DPI** w finalnym rozmiarze. Akapit o wysokości 100 px wypluje błędy, ten 400 px już nie.

Jak dokładny jest OCR w praktyce?

Na **czystej wydrukowanej stronie w obsługiwanym języku** spodziewaj się **98 do 99% trafności znaków**. Na **przyzwoitym zdjęciu paragonu z telefonu** raczej **90 do 95%** - wystarczy, żeby przeczytać, ale wynik trzeba przejrzeć pod kątem literówek. Na **rozmazanym, krzywym, niskorozdzielczym zdjęciu** dokładność spada poniżej 70%, wtedy ręczne przepisanie jest szybsze. **Procent pewności** pokazywany dla bloku jest dobrą wskazówką: powyżej 85 zwykle czysto, poniżej 60 podejrzane.

Mój obraz ma angielski i niemiecki - co wybrać?

Tesseract technicznie umie wczytać **kilka paczek naraz**, ale w praktyce **strony wielojęzyczne dają gorsze wyniki dla obu języków** niż wybór dominującego. **Wybierz język, który pokrywa większość tekstu**. Dla mocno wymieszanej strony uruchom OCR **dwa razy** (raz na język) i sklej fragmenty, którym ufasz, z każdego przejścia. Może dodamy tryb wielojęzyczny w przyszłości, ale dla niemal każdego prawdziwego dokumentu pojedynczy język to właściwy wybór.

Czy mogę wyciągnąć tabelę z wierszami i kolumnami?

**Tesseract czyta tekst, nie strukturę tabeli**. Dostaniesz zawartość komórek jako płaski strumień słów, mniej więcej w **kolejności czytania** (lewo do prawa, góra do dołu). Wizualna siatka **przepada** - w wyniku nie ma przecinków, tabulatorów ani znaczników kolumn. Dla prawdziwych danych tabelarycznych najlepszy workflow to: **OCR strony → ręcznie wklej wiersze do arkusza**, albo użyj dedykowanego narzędzia do tabel. Wszystko, co obiecuje "idealny Excel ze zrzutu", używa innego (i znacznie cięższego) modelu niż Tesseract.

Mój plik to PDF - czy używać tego narzędzia?

**Pewnie nie, sprawdź najpierw [ekstraktor tekstu z PDF](/wyciaganie-tekstu-pdf)**. Jeśli PDF powstał z eksportu z Worda, Google Docs, przeglądarki albo dowolnej nowoczesnej aplikacji, **zawiera już prawdziwy tekst** - wyciągnięcie go jest **natychmiastowe i bezbłędne**. OCR ma sens **tylko gdy PDF to zeskanowany obraz** (wydruk z kserokopiarki, "Zapisz jako obraz" do PDF, stary fax), a ekstraktor zwraca pustkę. Dla skanowanych PDFów wielostronicowych podziel je najpierw na strony i puść OCR po kolei - to narzędzie bierze jeden obraz naraz.

Czy mój obraz jest prywatny? Gdzie trafia?

Obraz **leci na nasz serwer**, żeby uruchomić Tesseracta - nie da się tego obejść, silnik potrzebuje pikseli. **Nigdy go nie zapisujemy na dysku, nigdy nie logujemy, nigdy nie składujemy**. Plik żyje **w pamięci procesu tylko tak długo**, żeby rozpoznać tekst (zwykle 2 do 10 sekund) i jest **czyszczony** w chwili wysłania odpowiedzi. Nie podglądamy też wyciągniętego tekstu poza odpowiedzią, którą do Ciebie zwracamy. Jeśli potrzebujesz mocniejszych gwarancji prywatności dla dokumentów poufnych, uruchom Tesseracta lokalnie - jest open source i to ten sam silnik.

Jaki jest maksymalny rozmiar obrazu?

**10 MB na plik**. Pokrywa praktycznie każdy JPG, PNG czy WebP z telefonu, skanera albo narzędzia do zrzutów. **Limit żądań** to **10 OCR-ów na godzinę z jednego IP** - OCR jest ciężki dla CPU i puszczamy go po stronie serwera, więc to chroni przed jednym użytkownikiem zajmującym wszystkie zasoby. Gdy trafisz na limit, poczekaj godzinę albo postaw Tesseracta lokalnie dla większej liczby plików. Pliki **powyżej 10 MB** odrzucamy z jasnym błędem - zwykle można zmniejszyć zdjęcie z telefonu do 1 do 2 MB bez utraty jakości OCR.

OCR ze zdjęcia - darmowy

OCR obrazu (Tesseract)

Upuść obraz tutaj

JPG, PNG, WebP do 10 MB

Obraz leci na nasz serwer tylko po to, żeby uruchomić Tesseracta. Nie zapisujemy go na dysk, nie logujemy i nie składujemy. Limit 10 OCR-ów na godzinę z IP.

Wyciągnięty tekst

Wynik OCR pojawi się tutaj po przetworzeniu obrazu.

Jak wyciągnąć tekst z obrazu (OCR)?

OCR obrazu czyta tekst na zdjęciu, zrzucie ekranu lub skanie i zwraca zwykły ciąg znaków, który możesz skopiować, wkleić albo przeszukać.

Wrzuć JPG, PNG lub WebP (do 10 MB), wybierz język, dostajesz rozpoznany tekst z procentem pewności dla każdego bloku.

Rozpoznawanie działa na naszym serwerze za pomocą Tesseract - silnika, który napędza Google Android - z paczkami angielską, polską, niemiecką, francuską i hiszpańską.

Najlepiej działa na czystych skanach, zrzutach ekranów, fakturach, paragonach i wydrukowanych stronach. Pismo odręczne i tła zaszumione poradzi sobie słabo.

Jak używać

Przeciągnij obraz na dropzonę albo kliknij "Wybierz plik" - przyjmujemy JPG, PNG, WebP. HEIC nie, najpierw przekonwertuj go w konwerterze HEIC.

Wybierz język zgodny z obrazem. Mieszanie języków na jednej stronie działa kiepsko - użyj dominującego.

Kliknij "Wyciągnij tekst". Pierwsze uruchomienie pobiera ~10 MB paczki językowej na serwerze, więc pierwsze wywołanie może trwać 5 do 15 sekund. Kolejne idą szybciej.

Przeczytaj wyciągnięty tekst w polu po prawej. "Kopiuj" wrzuca go do schowka, "Pobierz" zapisuje plik `.txt`.

Włącz "Pokaż ramki słów", żeby zobaczyć każde rozpoznane słowo na obrazie - przydaje się do wyłapywania pominiętych fragmentów albo miejsc o niskiej pewności.

Kiedy się przydaje

Gdzie OCR oszczędza czas - typowe sytuacje:

Cytat ze zrzutu ekranu w dokumencie albo czacie bez przepisywania słowo po słowie.
Wyciągnięcie telefonu, maila lub adresu ze zdjęcia wizytówki albo wydrukowanej ulotki.
Czytanie paragonu żeby spisać wydatek - pozycje i kwoty stają się szukalnym tekstem.
Tekst z UI, gdy programista albo projektant wysyła Ci płaski PNG bez edytowalnej warstwy.
Stare faktury i umowy, które kiedyś zeskanowano do PDF i straciły warstwę tekstową po drodze.
Memy, znaki, plakaty - szybki sposób, żeby chwycić hasło albo podpis.

Jeśli Twój plik to PDF z warstwą tekstową (większość PDFów z Worda, Pages, Chrome "Zapisz jako PDF" ma ją), użyj zamiast tego ekstraktora tekstu z PDF - działa natychmiast, jest dokładny i bez błędów OCR. OCR ma sens tylko gdy w pliku nie ma prawdziwego tekstu, tylko piksele.

Pytania i odpowiedzi

OCR to skrót od Optical Character Recognition - programu, który patrzy na piksele obrazu i decyduje "ten kształt to litera A, ten to B". Współczesny OCR (w tym Tesseract, który napędza to narzędzie) używa sieci neuronowej wytrenowanej na milionach kształtów liter, więc radzi sobie z różnymi fontami, rozmiarami i lekkim obrotem bez konfiguracji. Wynikiem jest zwykły tekst plus procent pewności od 0 do 100 dla każdego słowa i bloku.

Jak wyciągnąć tekst z obrazu (OCR)?

OCR obrazu czyta tekst na zdjęciu, zrzucie ekranu lub skanie i zwraca zwykły ciąg znaków, który możesz skopiować, wkleić albo przeszukać.

Wrzuć JPG, PNG lub WebP (do 10 MB), wybierz język, dostajesz rozpoznany tekst z procentem pewności dla każdego bloku.

Rozpoznawanie działa na naszym serwerze za pomocą Tesseract - silnika, który napędza Google Android - z paczkami angielską, polską, niemiecką, francuską i hiszpańską.

Najlepiej działa na czystych skanach, zrzutach ekranów, fakturach, paragonach i wydrukowanych stronach. Pismo odręczne i tła zaszumione poradzi sobie słabo.

Jak używać

Przeciągnij obraz na dropzonę albo kliknij "Wybierz plik" - przyjmujemy JPG, PNG, WebP. HEIC nie, najpierw przekonwertuj go w konwerterze HEIC.

Wybierz język zgodny z obrazem. Mieszanie języków na jednej stronie działa kiepsko - użyj dominującego.

Kliknij "Wyciągnij tekst". Pierwsze uruchomienie pobiera ~10 MB paczki językowej na serwerze, więc pierwsze wywołanie może trwać 5 do 15 sekund. Kolejne idą szybciej.

Przeczytaj wyciągnięty tekst w polu po prawej. "Kopiuj" wrzuca go do schowka, "Pobierz" zapisuje plik `.txt`.

Włącz "Pokaż ramki słów", żeby zobaczyć każde rozpoznane słowo na obrazie - przydaje się do wyłapywania pominiętych fragmentów albo miejsc o niskiej pewności.

Kiedy się przydaje

Gdzie OCR oszczędza czas - typowe sytuacje:

Cytat ze zrzutu ekranu w dokumencie albo czacie bez przepisywania słowo po słowie.
Wyciągnięcie telefonu, maila lub adresu ze zdjęcia wizytówki albo wydrukowanej ulotki.
Czytanie paragonu żeby spisać wydatek - pozycje i kwoty stają się szukalnym tekstem.
Tekst z UI, gdy programista albo projektant wysyła Ci płaski PNG bez edytowalnej warstwy.
Stare faktury i umowy, które kiedyś zeskanowano do PDF i straciły warstwę tekstową po drodze.
Memy, znaki, plakaty - szybki sposób, żeby chwycić hasło albo podpis.

Pytania i odpowiedzi

OCR ze zdjęcia

Upuść obraz tutaj

Jak wyciągnąć tekst z obrazu (OCR)?

Jak używać

Kiedy się przydaje

Pytania i odpowiedzi

Powiązane narzędzia

Konwerter obrazów

Ekstrakcja tekstu z PDF

Konwerter HEIC na JPG/PNG

Kompresor zdjęć

OCR ze zdjęcia

Upuść obraz tutaj

Jak wyciągnąć tekst z obrazu (OCR)?

Jak używać

Kiedy się przydaje

Pytania i odpowiedzi

Powiązane narzędzia

Konwerter obrazów

Ekstrakcja tekstu z PDF

Konwerter HEIC na JPG/PNG

Kompresor zdjęć