¿Cómo extraigo texto de una imagen (OCR)?
OCR de imagen lee el texto dentro de una foto, captura o escaneo y te devuelve una cadena plana que puedes copiar, buscar o pegar donde quieras.
Suelta un JPG, PNG o WebP (hasta 10 MB), elige un idioma y obtén el texto reconocido con un valor de confianza por bloque.
El reconocimiento se ejecuta en nuestro servidor con Tesseract, el mismo motor que Google creó para Android, con packs de inglés, polaco, alemán, francés y español.
Lo mejor para escaneos limpios, capturas de diálogos, facturas, tickets y páginas impresas. La escritura a mano y los fondos cargados darán problemas.
Cómo usarlo
- Arrastra tu imagen a la zona de drop o pulsa "Elegir archivo": se aceptan JPG, PNG, WebP; HEIC no (conviértelo antes con el conversor HEIC).
- Elige el idioma que coincida con tu imagen. Mezclar idiomas en una misma página funciona mal: usa el dominante.
- Pulsa "Extraer texto". La primera ejecución descarga un pack de idioma de ~10 MB en el servidor, así que la primera llamada puede tardar de 5 a 15 segundos; las siguientes son más rápidas.
- Lee el texto extraído en la caja de la derecha. Usa "Copiar" para llevarlo al portapapeles o "Descargar" para guardar un archivo `.txt`.
- Activa "Mostrar cajas de palabras" para superponer cada palabra reconocida sobre la imagen; útil para detectar zonas que se han escapado o trozos con baja confianza.
Cuándo es útil
Dónde se nota el OCR - situaciones típicas:
- Citar una captura en un documento o chat sin reescribirla palabra a palabra.
- Sacar un teléfono, correo o dirección de la foto de una tarjeta de visita o un folleto impreso.
- Leer un ticket para registrar un gasto: los totales y las líneas pasan a ser texto buscable.
- Levantar texto de una UI cuando un dev o diseñador te entrega un PNG plano sin capa editable.
- Facturas y contratos antiguos escaneados a PDF que perdieron la capa de texto en el camino.
- Memes, señales, carteles: capturar rápido el eslogan o caption.
Si tu archivo es un PDF que ya contiene capa de texto (la mayoría de PDF generados con Word / Pages / "Guardar como PDF" de Chrome la tienen), usa antes el extractor de texto de PDF: es instantáneo, perfectamente preciso y sin errores de OCR. OCR solo es la herramienta correcta cuando no hay texto real en el archivo, solo píxeles.