Sind diese Zahlen exakt oder nur Schätzungen?

**Exakt** für **GPT** (OpenAI) und **Claude** (Anthropic), wir nutzen dieselben Tokenizer, die die Anbieter selbst verwenden. Die Zahl hier ist **identisch** mit der, die ihr Service deiner App bei einem echten Aufruf in Rechnung stellt. **Näherungsweise** für **Gemini** (Google veröffentlicht keinen Tokenizer, den du im Browser laufen lassen kannst), genau auf **±10 %**. Zeilen, die in der Tabelle mit *"~est"* markiert sind, sind die geschätzten.

Warum kostet nicht-englischer Text mehr Token als englischer?

Weil die Modelle **überwiegend aus Englisch** gelernt haben. Tokenizer (jede Firma hat ihre eigene Art, Text zu zerlegen) *"verschmelzen"* häufige Buchstabenfolgen zu einer Einheit. **"Hello"** ist ein **häufiges Wort**, das der Tokenizer milliardenfach gesehen hat → 1 Token. **"こんにちは"** ("Hallo" auf Japanisch) hat **seltene Zeichen**, die der Tokenizer weit seltener gesehen hat → er teilt sie in einzelne Bytes → 4-5 Token. **Nicht-Englisch ist im Schnitt 2× teurer** als Englisch. Dasselbe gilt für Deutsch, Französisch, Japanisch, Polnisch, alles außer Englisch.

Liefert derselbe Text dieselbe Tokenzahl in GPT und Claude?

**Nein**. Jede Firma teilt Text auf ihre Weise. OpenAI hat eine Methode, Anthropic eine andere, Google noch eine. **Dieselben Wörter** können **unterschiedlich** geteilt werden, z. B. das Wort *"tokenizer"* ist 1 Token bei GPT, kann aber 2 bei Claude sein (token + izer). Für typischen Text beträgt der Unterschied zwischen Modellen **5-15 %**. Deshalb lohnt es sich, vor der Anbieterwahl zu vergleichen.

Wie prüfe ich, ob mein Prompt in den Kontext des Modells passt?

Paste den ganzen Prompt, die Tabelle zeigt dir den **% des Limits** für jedes Modell. **Denk dran**: dieses Limit muss auch die **Antwort des Modells** (typisch 4-8 Tausend Token) und den **Verlauf früherer Nachrichten** aufnehmen. Lass Spielraum. **Faustregel**: wenn dein Prompt über 70 % des Limits liegt, Zeit, ihn zu kürzen oder ein Modell mit größerem Fenster zu wählen.

Was bedeutet **"chars/token"**?

Das ist die **durchschnittliche Anzahl Zeichen pro einzelnem Token**. **Hoch** (z. B. 4,0) = **gutes Verhältnis**, viel Text passt in ein Token, du zahlst weniger. **Niedrig** (z. B. 1,5) = **teuer pro Zeichen**. **Typische Werte**: - **Englisch** ~4,0. - **Deutsch** ~2,5. - **Programmiercode** ~3,0. - **Emoji** sehr niedrig (0,5-1,0, ein einzelnes Emoji sind oft 3-4 Token).

Was ist die **"% Kontext-Füllung"**?

Jedes Modell hat ein **Limit, wie viel Text es auf einmal akzeptiert** (im Englischen: *"context window"*). **Claude Sonnet 4.5** passt z. B. **200.000 Token**. Wenn dein eingefügter Text 5.000 Token belegt, füllt er **2,5 %** dieses Limits. Der Prozentsatz klettert schnell, wenn du Chat-Verlauf und Dokument-Schnipsel hinzufügst, deshalb lohnt es sich, drauf zu achten.

Wird mein Text irgendwohin ins Internet gesendet?

**Nein**. Das ganze Zählen passiert **in deinem Browser, auf deinem Rechner**. Nichts geht an einen Server, nichts wird in einer Datenbank gespeichert. Du kannst es selbst prüfen: öffne die Entwicklertools (F12) → Network-Tab → du siehst keine ausgehenden Anfragen. **Sicher** für sensible Prompts: Firmen-Code, Kundendaten, unveröffentlichte Dokumente, interne Unterlagen.

Was bedeuten die farbigen Blöcke unten?

**Jeder Block ist ein Token**. **Wechselnde Farben** (blau / orange) helfen nur zu sehen, wo ein Token endet und das nächste beginnt. **Hover** über einen Block, um seine Nummer in der Reihenfolge zu sehen. **Sonderzeichen**: **⏎** = Zeilenumbruch, **→** = Tab (Einrückung). Super zum Lernen: sieh, wie dein Name, Fachwörter oder ein Code-Schnipsel zerlegt werden.

Wie zähle ich Token für Bilder, die ans Modell gehen?

Bilder werden **anders als Text gezählt**, und dieses Tool **macht das nicht**, es zeigt nur Text-Token. **Faustregel**: bei OpenAI ist ein hochauflösendes Bild ~1.000-2.000 Token, ein niedrig auflösendes ~85. Bei Claude ist ein Bild ~1.500 Token. Jeder Anbieter listet die Bildpreise in seiner Doku.

Kann ich einen wirklich langen Text einfügen, wie ein ganzes Buch?

**Ja**, bis etwa **500.000 Zeichen**. Darüber kann das Zählen **ein paar Sekunden** dauern (der Browser zählt in einem einzigen Thread, die Seite friert kurz ein). Die Block-Visualisierung zeigt jedes Token, aber jenseits ~50.000 Token kann das Scrollen der Liste träge werden. Für wirklich riesige Dateien zähl in Stücken.

LLM-Token-Zähler - kostenlos

Modell	Tokens	Zeichen/Token	Kontextfüllung
GPT-4oOpenAI	14	4.07	0.01%
GPT-4o miniOpenAI	14	4.07	0.01%
Claude Sonnet 4.5Anthropic~est	18	3.17	<0.01%
Claude Haiku 4.5Anthropic~est	18	3.17	<0.01%
Claude Opus 4.7Anthropic~est	18	3.17	<0.01%
Gemini 2.5 ProGoogle~est	17	3.35	<0.01%
Gemini 2.5 FlashGoogle~est	17	3.35	<0.01%

Modell

Tokens

Zeichen/Token

Kontextfüllung

GPT-4oOpenAI

4.07

0.01%

GPT-4o miniOpenAI

4.07

0.01%

Claude Sonnet 4.5Anthropic~est

3.17

<0.01%

Claude Haiku 4.5Anthropic~est

3.17

<0.01%

Claude Opus 4.7Anthropic~est

3.17

<0.01%

Gemini 2.5 ProGoogle~est

3.35

<0.01%

Gemini 2.5 FlashGoogle~est

3.35

<0.01%

Wie viel kostet mein Prompt? Token zählen für GPT, Claude und Gemini

Paste einen beliebigen Text ein, dieses Tool zeigt in wie viele Stücke die beliebtesten Bots ihn zerlegen: GPT-4o, GPT-4o mini, Claude Sonnet 4.5, Claude Haiku 4.5, Claude Opus 4.7, Gemini 2.5 Pro und Gemini 2.5 Flash. Alle sieben auf einmal, ohne Anmeldung.

Ein Token ist ein Textstück, das das Modell als eine Einheit behandelt. Meistens ein Wortteil, manchmal ein ganzes kurzes Wort. Faustregel: ein englisches Wort ≈ 1,3 Token, ein deutsches Wort ≈ 1,5-2 Token. Je mehr Token, desto mehr zahlst du pro Frage und desto näher kommst du an die Grenze dessen, wie viel das Modell auf einmal liest.

Unter den Zahlen siehst du farbige Blöcke, jeder Block ist ein Token. Das baut Intuition auf: du siehst, wie das Modell deinen Satz *"betrachtet"* und warum Deutsch mehr kostet als Englisch.

So nutzt du es

Paste deinen Text in das obere Feld. Ein Prompt fürs Modell, ein Doku-Schnipsel, Code, eine Nachricht, alles.
Darunter bekommst du eine Tabelle: wie viele Token dein Text in jedem Modell hat, wie viele Zeichen pro Token und welchen Prozentsatz des Limits du nutzt.
Die günstigste Option (wenigste Token = günstigster Aufruf) wird grün hervorgehoben, die teuerste rot.
Klick eine Zeile an, um die farbigen Blöcke unten zu sehen, jeder ist ein einzelnes Token in diesem Modell.
Klick auf das Kopier-Symbol in einer Zeile, um die Tokenzahl direkt in die Zwischenablage zu schicken. Praktisch, wenn du sie mit einem Preislisten-Tarif multiplizieren willst.

Wann das nützlich ist

Sechs typische Situationen, in denen der Token-Zähler eine konkrete Antwort statt einer Schätzung liefert:

Ein Bot-Projekt kalkulieren. Ein Kunde fragt *"was kostet mich der Chatbot mit diesem Prompt?"*. Tipp den Prompt ein, multiplizier die Token mit dem Anbieter-Preis, du hast eine reale Zahl statt einer Schätzung.
Prüfen, ob dein Text reinpasst. Du hast lange Anweisungen fürs Modell, plus Chat-Verlauf, plus Dokumente aus einer Wissensdatenbank. Passt das alles ins 200.000-Token-Limit von Claude? Tipp es ein und sieh die Antwort sofort.
Sprachen vergleichen. Nicht-englischer Text nutzt etwa doppelt so viele Token wie englischer (die Modelle lernten vor allem aus Englisch). Sieh genau: "Hallo Welt" = 4 Token, "Hello world" = 2.
Kostenoptimierung. GPT-4o nutzt für denselben Text vielleicht 15 % weniger Token als Claude. Bei 10 Millionen Fragen pro Monat sind das echtes Geld über ein Jahr.
**Den *"Text zu lang"*-Fehler abfangen. Das Modell hat einen Fehler zurückgegeben, dass deine Eingabe nicht passt, aber du weißt nicht, welches Stück sie übers Limit gebracht hat. Paste Fragmente einzeln und find das Stück, das das Limit brach**.
Einen Bot planen, der mit deinen Dokumenten plaudert. Sagen wir, du hast 10.000 Dateien mit je 500 Token. Das sind 5 Millionen Token insgesamt. Berechne die Kosten fürs Aufteilen in Chunks und Umwandeln in ein Format, das das Modell versteht, kenn die Rechnung, bevor du ausgibst.

Fragen und Antworten

Paste ihn ins obere Feld, das Tool zählt sofort für 7 Modelle gleichzeitig. Faustregel, wenn du den Text nicht zur Hand hast: - Englisches Wort ≈ 1,3 Token. - Deutsches Wort ≈ 1,5-2 Token. - kurze E-Mail = 100-300 Token. - A4-Seite in Englisch = 300-400 Token. - Blog-Artikel (1.000 Wörter) = 1.300-1.500 Token.

Modell	Tokens	Zeichen/Token	Kontextfüllung
GPT-4oOpenAI	14	4.07	0.01%
GPT-4o miniOpenAI	14	4.07	0.01%
Claude Sonnet 4.5Anthropic~est	18	3.17	<0.01%
Claude Haiku 4.5Anthropic~est	18	3.17	<0.01%
Claude Opus 4.7Anthropic~est	18	3.17	<0.01%
Gemini 2.5 ProGoogle~est	17	3.35	<0.01%
Gemini 2.5 FlashGoogle~est	17	3.35	<0.01%

Modell

Tokens

Zeichen/Token

Kontextfüllung

GPT-4oOpenAI

4.07

0.01%

GPT-4o miniOpenAI

4.07

0.01%

Claude Sonnet 4.5Anthropic~est

3.17

<0.01%

Claude Haiku 4.5Anthropic~est

3.17

<0.01%

Claude Opus 4.7Anthropic~est

3.17

<0.01%

Gemini 2.5 ProGoogle~est

3.35

<0.01%

Gemini 2.5 FlashGoogle~est

3.35

<0.01%

Wie viel kostet mein Prompt? Token zählen für GPT, Claude und Gemini

Unter den Zahlen siehst du farbige Blöcke, jeder Block ist ein Token. Das baut Intuition auf: du siehst, wie das Modell deinen Satz *"betrachtet"* und warum Deutsch mehr kostet als Englisch.

So nutzt du es

Paste deinen Text in das obere Feld. Ein Prompt fürs Modell, ein Doku-Schnipsel, Code, eine Nachricht, alles.

Darunter bekommst du eine Tabelle: wie viele Token dein Text in jedem Modell hat, wie viele Zeichen pro Token und welchen Prozentsatz des Limits du nutzt.

Die günstigste Option (wenigste Token = günstigster Aufruf) wird grün hervorgehoben, die teuerste rot.

Klick eine Zeile an, um die farbigen Blöcke unten zu sehen, jeder ist ein einzelnes Token in diesem Modell.

Klick auf das Kopier-Symbol in einer Zeile, um die Tokenzahl direkt in die Zwischenablage zu schicken. Praktisch, wenn du sie mit einem Preislisten-Tarif multiplizieren willst.

Wann das nützlich ist

Sechs typische Situationen, in denen der Token-Zähler eine konkrete Antwort statt einer Schätzung liefert:

Ein Bot-Projekt kalkulieren. Ein Kunde fragt *"was kostet mich der Chatbot mit diesem Prompt?"*. Tipp den Prompt ein, multiplizier die Token mit dem Anbieter-Preis, du hast eine reale Zahl statt einer Schätzung.
Prüfen, ob dein Text reinpasst. Du hast lange Anweisungen fürs Modell, plus Chat-Verlauf, plus Dokumente aus einer Wissensdatenbank. Passt das alles ins 200.000-Token-Limit von Claude? Tipp es ein und sieh die Antwort sofort.
Sprachen vergleichen. Nicht-englischer Text nutzt etwa doppelt so viele Token wie englischer (die Modelle lernten vor allem aus Englisch). Sieh genau: "Hallo Welt" = 4 Token, "Hello world" = 2.
Kostenoptimierung. GPT-4o nutzt für denselben Text vielleicht 15 % weniger Token als Claude. Bei 10 Millionen Fragen pro Monat sind das echtes Geld über ein Jahr.
**Den *"Text zu lang"*-Fehler abfangen. Das Modell hat einen Fehler zurückgegeben, dass deine Eingabe nicht passt, aber du weißt nicht, welches Stück sie übers Limit gebracht hat. Paste Fragmente einzeln und find das Stück, das das Limit brach**.
Einen Bot planen, der mit deinen Dokumenten plaudert. Sagen wir, du hast 10.000 Dateien mit je 500 Token. Das sind 5 Millionen Token insgesamt. Berechne die Kosten fürs Aufteilen in Chunks und Umwandeln in ein Format, das das Modell versteht, kenn die Rechnung, bevor du ausgibst.

Fragen und Antworten

LLM-Token-Zähler

Wie viel kostet mein Prompt? Token zählen für GPT, Claude und Gemini

So nutzt du es

Wann das nützlich ist

Fragen und Antworten

Passende Tools

LLM-Kosten-Rechner

LLM-Modell-Vergleicher

Wort- und Zeichen-Zähler

LLM-Token-Zähler

Wie viel kostet mein Prompt? Token zählen für GPT, Claude und Gemini

So nutzt du es

Wann das nützlich ist

Fragen und Antworten

Passende Tools

LLM-Kosten-Rechner

LLM-Modell-Vergleicher

Wort- und Zeichen-Zähler