`, il contient la string littérale de huit caractères `<div>`. Contextes différents, encodeurs différents."}},{"@type":"Question","name":"Pourquoi certains caractères comme les emoji ou le texte asiatique sont-ils encodés en paire de nombres ?","acceptedAnswer":{"@type":"Answer","text":"Parce que **les emoji et beaucoup de caractères asiatiques vivent au-dessus du plan Unicode basique**, ils utilisent deux **unités de code UTF-16** en interne en JavaScript. Quand l'outil les encode comme références numériques, il émet correctement le **codepoint** complet (un nombre, pas deux). **Exemple** : 🎉 encode comme `🎉` (un seul codepoint), pas deux références séparées. **Le décodage** inverse ça parfaitement. Si vous voyez des séquences bizarres de deux nombres dans votre entrée, ça signifie que celui qui a encodé avant n'a PAS géré les paires de substitution correctement, passez l'entrée dans Decode et l'outil la réparera."}},{"@type":"Question","name":"Ça marche hors ligne ? Mon texte est-il uploadé quelque part ?","acceptedAnswer":{"@type":"Answer","text":"**Tout tourne dans votre navigateur.** Pas d'appels serveur, pas d'analytics sur l'entrée, pas d'upload. Vous pouvez ouvrir l'onglet **Network** dans DevTools et confirmer : zéro requête quand vous tapez. Sûr pour **le contenu sensible** : docs légaux, templates internes, données clients. **Marche hors ligne** aussi : une fois la page chargée, la logique d'encodage est entièrement JavaScript côté client, vous pouvez débrancher le Wi-Fi et continuer à travailler. **La table de référence d'entités** (top 30 entités nommées) est intégrée directement dans le bundle de la page."}},{"@type":"Question","name":"Pourquoi mon espace insécable ( ) décode-t-il en espace normal ?","acceptedAnswer":{"@type":"Answer","text":"**Ce n'est pas le cas, il décode en espace insécable.** Ils ont l'air identiques mais ce sont des caractères différents : l'espace normal est **U+0020**, l'espace insécable est **U+00A0**. Copiez la sortie décodée et collez-la dans un inspecteur Unicode et vous verrez U+00A0. **Les navigateurs les rendent de la même manière**, c'est pour ça que ça ressemble à un espace normal. **Important** : les espaces insécables dans la source HTML peuvent casser les calculs de layout, la regex `\\s` les matche mais `\" \"` (espace littéral) non. Si vous voulez **les convertir en vrais espaces** après décodage, passez la sortie par notre outil rechercher-et-remplacer."}},{"@type":"Question","name":"Quelle est la différence entre A et A ?","acceptedAnswer":{"@type":"Answer","text":"**Même caractère, bases de nombres différentes.** `A` est la référence numérique **décimale** pour le codepoint 65 (la lettre A). `A` est la forme **hexadécimale** du même nombre (0x41 = 65 en décimal). Les deux décodent en 'A'. **Pourquoi les deux existent** : hex est plus compact pour les codepoints élevés (`🎉` versus `🎉` pour 🎉), et correspond à comment les codepoints Unicode sont généralement écrits dans la documentation (U+1F389). Décimal est plus ancien et plus lisible pour la plage ASCII. **Les navigateurs acceptent l'un ou l'autre**, le décodage est identique. **Pour l'encodage** : cet outil émet du décimal par défaut, c'est la convention la plus courante dans le HTML du monde réel."}}]}
Encodeur entités HTML
Encode et décode les entités HTML - &, <, >, accents.
LiveFonctionne dans ton navigateur
Encode seulement les 5 caractères significatifs en HTML : & < > " '. Les accents restent tels quels.
Entités nommées les plus utiliséesCliquez sur une ligne pour la copier.
Que sont les entités HTML et quand en ai-je besoin ?
Certains caractères ont une signification spéciale pour un navigateur. Tapez un signe inférieur à littéral dans votre CMS et le navigateur pense qu'une balise commence. Collez une esperluette dans une URL et un autre paramètre prend le dessus. Le correctif : les entités HTML, des codes courts comme `&lt;` ou `&amp;` qui montrent le vrai caractère sans embrouiller le parser.
Tout s'exécute dans votre navigateur : rien ne quitte la page, pas d'inscription, pas de quota. Épinglée en bas : une table de référence des 30 entités nommées les plus utilisées, cliquez sur n'importe quelle ligne pour la copier.
Comment l'utiliser
Choisissez une direction : Encode (texte vers entités) ou Decode (entités vers texte). Barre d'interrupteur en haut de la page.
Collez votre texte à gauche. Le résultat apparaît à droite instantanément : pas de bouton Run, pas de délai.
Cliquez sur Copy pour récupérer la sortie. Ou Swap pour repasser le résultat dans la direction opposée (utile pour des tests aller-retour).
Besoin d'une entité spécifique ? Ouvrez la table de référence en bas (les 30 meilleures entités nommées), cliquez sur n'importe quelle ligne pour copier ce token d'entité exact.
Le décodage gère tout : entités nommées (`&copy;`), numériques décimales (`&#65;`), hex numériques (`&#x41;`). L'entrée mixte marche aussi.
Quand c'est utile
Six situations où cet outil vous évite une page cassée ou une faille de sécurité :
Afficher des exemples de code sur un blog. Vous voulez afficher `<div class="foo">` comme texte littéral dans un tuto. Sans encodage, le navigateur mange la balise et vous obtenez une boîte vide. Encode en mode Strict transforme les chevrons en `<` et `>` pour que le markup apparaisse comme texte.
Coller du contenu de Word ou Google Docs dans un CMS. Le doc a des guillemets typographiques (`“ ”`), des tirets cadratins (`-`), des espaces insécables. Certains CMS s'étranglent là-dessus. Encode en mode Named les remplace par des entités lisibles comme `“` et `—` que tout système gère.
Stopper une tentative XSS basique. Un utilisateur soumet `<script>alert("xss")</script>` à votre formulaire de commentaires. Affichez-le brut et le script tourne dans le navigateur de chaque visiteur. Encode en mode Strict le transforme en texte inoffensif. Une vraie défense demande plus que ça, mais encoder la sortie est l'étape un.
Nettoyer de vieux emails HTML ou des pages scrapées. Vous copiez du texte d'une vieille newsletter et c'est plein d'artefacts `&eacute;` et `&#8230;`. Decode les retransforme en propres é et …, prêts à coller dans un document frais.
Envoyer du contenu email via des systèmes legacy. Certains anciens serveurs mail et moteurs de templating dégagent les caractères non-ASCII. Encode en mode Numeric all transforme é en `&#233;`, qui survit au voyage et rend correctement dans n'importe quel client mail.
Construire un attribut srcdoc d'iframe. Le HTML à l'intérieur de `srcdoc="..."` a besoin de ses guillemets échappés ou tout casse. Encode en mode Strict est exactement ce qu'il faut : il touche seulement les caractères dont le parser se soucie, laisse le reste lisible.