Wie viel kostet mein Prompt? Token zählen für GPT, Claude und Gemini
Paste einen beliebigen Text ein, dieses Tool zeigt in wie viele Stücke die beliebtesten Bots ihn zerlegen: GPT-4o, GPT-4o mini, Claude Sonnet 4.5, Claude Haiku 4.5, Claude Opus 4.7, Gemini 2.5 Pro und Gemini 2.5 Flash. Alle sieben auf einmal, ohne Anmeldung.
Ein Token ist ein Textstück, das das Modell als eine Einheit behandelt. Meistens ein Wortteil, manchmal ein ganzes kurzes Wort. Faustregel: ein englisches Wort ≈ 1,3 Token, ein deutsches Wort ≈ 1,5-2 Token. Je mehr Token, desto mehr zahlst du pro Frage und desto näher kommst du an die Grenze dessen, wie viel das Modell auf einmal liest.
Unter den Zahlen siehst du farbige Blöcke, jeder Block ist ein Token. Das baut Intuition auf: du siehst, wie das Modell deinen Satz *"betrachtet"* und warum Deutsch mehr kostet als Englisch.
So nutzt du es
- Paste deinen Text in das obere Feld. Ein Prompt fürs Modell, ein Doku-Schnipsel, Code, eine Nachricht, alles.
- Darunter bekommst du eine Tabelle: wie viele Token dein Text in jedem Modell hat, wie viele Zeichen pro Token und welchen Prozentsatz des Limits du nutzt.
- Die günstigste Option (wenigste Token = günstigster Aufruf) wird grün hervorgehoben, die teuerste rot.
- Klick eine Zeile an, um die farbigen Blöcke unten zu sehen, jeder ist ein einzelnes Token in diesem Modell.
- Klick auf das Kopier-Symbol in einer Zeile, um die Tokenzahl direkt in die Zwischenablage zu schicken. Praktisch, wenn du sie mit einem Preislisten-Tarif multiplizieren willst.
Wann das nützlich ist
Sechs typische Situationen, in denen der Token-Zähler eine konkrete Antwort statt einer Schätzung liefert:
- Ein Bot-Projekt kalkulieren. Ein Kunde fragt *"was kostet mich der Chatbot mit diesem Prompt?"*. Tipp den Prompt ein, multiplizier die Token mit dem Anbieter-Preis, du hast eine reale Zahl statt einer Schätzung.
- Prüfen, ob dein Text reinpasst. Du hast lange Anweisungen fürs Modell, plus Chat-Verlauf, plus Dokumente aus einer Wissensdatenbank. Passt das alles ins 200.000-Token-Limit von Claude? Tipp es ein und sieh die Antwort sofort.
- Sprachen vergleichen. Nicht-englischer Text nutzt etwa doppelt so viele Token wie englischer (die Modelle lernten vor allem aus Englisch). Sieh genau: "Hallo Welt" = 4 Token, "Hello world" = 2.
- Kostenoptimierung. GPT-4o nutzt für denselben Text vielleicht 15 % weniger Token als Claude. Bei 10 Millionen Fragen pro Monat sind das echtes Geld über ein Jahr.
- **Den *"Text zu lang"*-Fehler abfangen. Das Modell hat einen Fehler zurückgegeben, dass deine Eingabe nicht passt, aber du weißt nicht, welches Stück sie übers Limit gebracht hat. Paste Fragmente einzeln und find das Stück, das das Limit brach**.
- Einen Bot planen, der mit deinen Dokumenten plaudert. Sagen wir, du hast 10.000 Dateien mit je 500 Token. Das sind 5 Millionen Token insgesamt. Berechne die Kosten fürs Aufteilen in Chunks und Umwandeln in ein Format, das das Modell versteht, kenn die Rechnung, bevor du ausgibst.