Comment extraire du texte d'une image (OCR) ?
L'OCR d'image lit le texte présent dans une photo, capture ou scan et te renvoie une chaîne brute que tu peux copier, rechercher ou coller où tu veux.
Dépose un JPG, PNG ou WebP (jusqu'à 10 MB), choisis une langue, obtiens le texte reconnu avec un score de confiance par bloc.
La reconnaissance tourne sur notre serveur avec Tesseract, le même moteur que Google a construit pour Android, avec les packs de langue anglais, polonais, allemand, français et espagnol.
Idéal pour les scans propres, les captures de boîtes de dialogue, les factures, les tickets de caisse et les pages imprimées. L'écriture manuscrite et les fonds chargés galèrent.
Comment l'utiliser
- Glisse ton image dans la dropzone ou clique sur « Choisir un fichier » : JPG, PNG, WebP sont acceptés, le HEIC non (convertis-le d'abord avec le convertisseur HEIC).
- Choisis la langue qui correspond à ton image. Mélanger les langues sur une page marche mal : prends la dominante.
- Clique sur « Extraire le texte ». Le premier run télécharge un pack de langue d'environ 10 MB sur le serveur, donc le tout premier appel peut prendre 5 à 15 secondes ; les appels suivants sont plus rapides.
- Lis le texte extrait dans la boîte de droite. Utilise « Copier » pour le mettre dans le presse-papiers ou « Télécharger » pour sauver un fichier `.txt`.
- Active « Afficher les boîtes de mots » pour superposer chaque mot reconnu sur l'image : utile pour repérer les régions ratées ou les zones de faible confiance.
Quand c'est utile
Là où l'OCR paie, situations typiques :
- Citer une capture d'écran dans un doc ou un chat sans la retaper mot par mot.
- Récupérer un numéro de téléphone, e-mail ou adresse sur la photo d'une carte de visite ou d'un flyer imprimé.
- Lire un reçu pour suivre une dépense : les totaux et lignes deviennent du texte cherchable.
- Extraire du texte d'une UI quand un dev ou designer t'envoie un PNG plat sans calque éditable.
- Vieilles factures et contrats scannés en PDF qui ont perdu leur couche texte en route.
- Memes, panneaux, affiches : récupère vite le slogan ou la légende.
Si ton fichier est un PDF qui contient déjà une couche texte (la plupart des PDF de Word / Pages / Chrome « Enregistrer en PDF » en ont), utilise plutôt l'extracteur de texte PDF : il est instantané, parfaitement précis et exempt d'erreurs OCR. L'OCR n'est le bon outil que quand il n'y a pas de vrai texte dans le fichier, seulement des pixels.