¿Cuándo funciona bien el OCR y cuándo falla?

**Funciona bien**: escaneos limpios a 300 DPI o más, capturas de texto digital, páginas impresas, facturas y tickets en fuentes estándar, fondo blanco con texto oscuro. **Falla o le cuesta**: **escritura a mano** (Tesseract está entrenado con texto impreso, no cursiva), **fondos cargados** (texto sobre fotos), **baja resolución** (menos de ~150 px de alto por línea), **texto inclinado o curvado**, **fuentes muy estilizadas**, **reflejos** en el original. Si un humano puede leerlo en medio segundo, Tesseract lo sacará. Si tienes que entornar los ojos, espera errores.

¿Qué idiomas están soportados?

Cinco packs de idioma conectados: **inglés (eng)**, **polaco (pol)**, **alemán (deu)**, **francés (fra)** y **español (spa)**. Tesseract en sí soporta **más de 100 idiomas**, incluidos alfabetos no latinos (árabe, chino, hindi, cirílico); si necesitas otro, abre una issue y lo habilitaremos. **Elige el idioma que coincida con la imagen**: pasar OCR en polaco a una página en inglés produce galimatías, y al revés.

¿Cómo obtengo un mejor resultado? ¿Algún consejo de preprocesado?

**Recorta ajustado** al texto: las zonas irrelevantes solo confunden al motor. **Aumenta el contraste** si la imagen está descolorida (un "auto levels" rápido en cualquier app de fotos ayuda). **Endereza** si la página está inclinada más de unos grados: las líneas horizontales rectas funcionan mejor. **Evita artefactos JPEG** sobre el texto: vuelve a guardar el origen como PNG si puedes. **Apunta a ~300 DPI** al tamaño final; un párrafo de 100 px de alto fallará, uno de 400 px no.

¿Qué precisión tiene el OCR en la práctica?

En una **página impresa limpia y en un idioma soportado** espera **98-99% de precisión por carácter**. En una **foto decente de móvil de un ticket**, más bien **90-95%**: suficiente para leerlo, pero querrás revisar el resultado en busca de erratas. En una **foto borrosa, torcida y de baja resolución**, la precisión puede caer por debajo del 70%, momento en el que es más rápido reescribir. El **porcentaje de confianza** que muestra la herramienta por bloque es una buena guía: por encima de 85 suele estar limpio, por debajo de 60 es sospechoso.

Mi imagen tiene inglés y alemán mezclados, ¿qué hago?

Tesseract puede cargar **varios packs de idioma a la vez**, pero en la práctica **las páginas con idiomas mezclados producen peores resultados** para ambos que escoger el dominante. **Elige el idioma que cubra la mayor parte del texto**. En una página muy mezclada, ejecuta OCR **dos veces** (una por idioma) y junta las partes que te convenzan de cada pasada. Quizá añadamos un modo multi-idioma en el futuro, pero el predeterminado de un solo idioma es la elección correcta para casi cualquier documento real.

¿Puedo extraer una tabla con filas y columnas?

**Tesseract lee texto, no estructura de tabla**. Obtendrás el contenido de las celdas como un flujo plano de palabras, en aproximadamente **orden de lectura** (izquierda a derecha, arriba abajo). La cuadrícula visual se **pierde**: no hay comas, tabuladores ni marcadores de columna en la salida. Para datos tabulares reales, el mejor flujo es: **OCR la página → pegar filas a mano en una hoja de cálculo**, o usar una herramienta dedicada a extracción de tablas. Cualquier cosa que prometa "Excel perfecto desde una captura" usa un modelo de ML distinto (y mucho más pesado) que Tesseract.

Mi archivo es un PDF, ¿debo usar esta herramienta?

**Probablemente no, prueba antes el [extractor de texto de PDF](/es/extraer-texto-pdf)**. Si el PDF se hizo exportando desde Word, Google Docs, un navegador o cualquier app moderna, **ya contiene texto real**: extraerlo es **instantáneo y perfecto**. Usa OCR **solo cuando el PDF sea una imagen escaneada** (salida de fotocopiadora, PDF "Guardar como imagen", un fax antiguo) y el extractor de texto devuelva vacío. Para PDFs escaneados de varias páginas, separa primero las páginas y haz OCR una a una: esta herramienta trabaja con una imagen cada vez.

¿Mi imagen es privada? ¿A dónde va?

La imagen se **envía a nuestro servidor** para ejecutar Tesseract: no hay forma de evitarlo, el motor necesita los píxeles. **Nunca la escribimos en disco, nunca la logueamos, nunca la guardamos**. El archivo vive en **memoria del proceso solo el tiempo suficiente** para reconocer el texto (normalmente 2-10 segundos) y se **libera** en cuanto se envía la respuesta. Tampoco **vemos el texto extraído** más allá de la respuesta que te devolvemos. Si necesitas garantías más estrictas de privacidad para documentos confidenciales, ejecuta Tesseract en local: es open source y es el mismo motor que usamos.

¿Cuál es el tamaño máximo de imagen?

**10 MB por archivo**. Cubre prácticamente cualquier JPG, PNG o WebP procedente de un móvil, escáner o herramienta de captura. El **rate limit** es de **10 ejecuciones de OCR por hora por IP**: el OCR es intensivo en CPU y lo ejecutamos en servidor, así que esto evita que un único usuario monopolice el worker. Si llegas al límite, espera una hora o ejecuta Tesseract en local para trabajos masivos. Los archivos **por encima de 10 MB** se rechazan con un error claro; normalmente puedes reducir una foto de móvil a 1-2 MB sin perder calidad de OCR.

OCR de imágenes - gratis

OCR de imágenes (Tesseract)

Suelta una imagen aquí

JPG, PNG, WebP hasta 10 MB

La imagen se envía a nuestro servidor solo para ejecutar Tesseract. No se escribe en disco, ni se registra, ni se almacena. Límite de 10 ejecuciones de OCR por hora por IP.

Texto extraído

El resultado del OCR aparecerá aquí cuando se procese la imagen.

¿Cómo extraigo texto de una imagen (OCR)?

OCR de imagen lee el texto dentro de una foto, captura o escaneo y te devuelve una cadena plana que puedes copiar, buscar o pegar donde quieras.

Suelta un JPG, PNG o WebP (hasta 10 MB), elige un idioma y obtén el texto reconocido con un valor de confianza por bloque.

El reconocimiento se ejecuta en nuestro servidor con Tesseract, el mismo motor que Google creó para Android, con packs de inglés, polaco, alemán, francés y español.

Lo mejor para escaneos limpios, capturas de diálogos, facturas, tickets y páginas impresas. La escritura a mano y los fondos cargados darán problemas.

Cómo usarlo

Arrastra tu imagen a la zona de drop o pulsa "Elegir archivo": se aceptan JPG, PNG, WebP; HEIC no (conviértelo antes con el conversor HEIC).

Elige el idioma que coincida con tu imagen. Mezclar idiomas en una misma página funciona mal: usa el dominante.

Pulsa "Extraer texto". La primera ejecución descarga un pack de idioma de ~10 MB en el servidor, así que la primera llamada puede tardar de 5 a 15 segundos; las siguientes son más rápidas.

Lee el texto extraído en la caja de la derecha. Usa "Copiar" para llevarlo al portapapeles o "Descargar" para guardar un archivo `.txt`.

Activa "Mostrar cajas de palabras" para superponer cada palabra reconocida sobre la imagen; útil para detectar zonas que se han escapado o trozos con baja confianza.

Cuándo es útil

Dónde se nota el OCR - situaciones típicas:

Citar una captura en un documento o chat sin reescribirla palabra a palabra.
Sacar un teléfono, correo o dirección de la foto de una tarjeta de visita o un folleto impreso.
Leer un ticket para registrar un gasto: los totales y las líneas pasan a ser texto buscable.
Levantar texto de una UI cuando un dev o diseñador te entrega un PNG plano sin capa editable.
Facturas y contratos antiguos escaneados a PDF que perdieron la capa de texto en el camino.
Memes, señales, carteles: capturar rápido el eslogan o caption.

Si tu archivo es un PDF que ya contiene capa de texto (la mayoría de PDF generados con Word / Pages / "Guardar como PDF" de Chrome la tienen), usa antes el extractor de texto de PDF: es instantáneo, perfectamente preciso y sin errores de OCR. OCR solo es la herramienta correcta cuando no hay texto real en el archivo, solo píxeles.

Preguntas y respuestas

OCR son las siglas de Optical Character Recognition (reconocimiento óptico de caracteres): software que mira los píxeles de una imagen y decide "esta forma es la letra A, esta otra una B". El OCR moderno (incluido Tesseract, que mueve esta herramienta) usa una red neuronal entrenada con millones de formas de letras, así que maneja distintas fuentes, tamaños y ligeras rotaciones sin que tengas que ajustar nada. La salida es una cadena de texto plano más un valor de confianza entre 0 y 100 por cada palabra y bloque.

¿Cómo extraigo texto de una imagen (OCR)?

OCR de imagen lee el texto dentro de una foto, captura o escaneo y te devuelve una cadena plana que puedes copiar, buscar o pegar donde quieras.

Suelta un JPG, PNG o WebP (hasta 10 MB), elige un idioma y obtén el texto reconocido con un valor de confianza por bloque.

El reconocimiento se ejecuta en nuestro servidor con Tesseract, el mismo motor que Google creó para Android, con packs de inglés, polaco, alemán, francés y español.

Lo mejor para escaneos limpios, capturas de diálogos, facturas, tickets y páginas impresas. La escritura a mano y los fondos cargados darán problemas.

Cómo usarlo

Arrastra tu imagen a la zona de drop o pulsa "Elegir archivo": se aceptan JPG, PNG, WebP; HEIC no (conviértelo antes con el conversor HEIC).

Elige el idioma que coincida con tu imagen. Mezclar idiomas en una misma página funciona mal: usa el dominante.

Lee el texto extraído en la caja de la derecha. Usa "Copiar" para llevarlo al portapapeles o "Descargar" para guardar un archivo `.txt`.

Activa "Mostrar cajas de palabras" para superponer cada palabra reconocida sobre la imagen; útil para detectar zonas que se han escapado o trozos con baja confianza.

Cuándo es útil

Dónde se nota el OCR - situaciones típicas:

Citar una captura en un documento o chat sin reescribirla palabra a palabra.
Sacar un teléfono, correo o dirección de la foto de una tarjeta de visita o un folleto impreso.
Leer un ticket para registrar un gasto: los totales y las líneas pasan a ser texto buscable.
Levantar texto de una UI cuando un dev o diseñador te entrega un PNG plano sin capa editable.
Facturas y contratos antiguos escaneados a PDF que perdieron la capa de texto en el camino.
Memes, señales, carteles: capturar rápido el eslogan o caption.

Preguntas y respuestas

OCR de imágenes

Suelta una imagen aquí

¿Cómo extraigo texto de una imagen (OCR)?

Cómo usarlo

Cuándo es útil

Preguntas y respuestas

Herramientas relacionadas

Conversor de imágenes

Extractor de texto de PDF

Conversor HEIC a JPG/PNG

Compresor de imágenes

OCR de imágenes

Suelta una imagen aquí

¿Cómo extraigo texto de una imagen (OCR)?

Cómo usarlo

Cuándo es útil

Preguntas y respuestas

Herramientas relacionadas

Conversor de imágenes

Extractor de texto de PDF

Conversor HEIC a JPG/PNG

Compresor de imágenes