Nutzungslimits & Fair Use Policy
innoGPT bietet einen fairen Flatrate-Preis – damit das für alle funktioniert, gelten transparente Nutzungslimits, die sicherstellen, dass die Plattform für jeden Nutzer stabil und schnell bleibt.
Warum gibt es überhaupt Limits?
Im Hintergrund jeder Anfrage entstehen reale Kosten: innoGPT zahlt pro verwendetem Token an die jeweiligen Modellanbieter (z. B. OpenAI oder Anthropic). Gleichzeitig bieten wir euch einen festen Flatrate-Preis. Die Limits sind dabei großzügig kalkuliert. Damit das dauerhaft funktioniert und die Plattform für alle Nutzer stabil bleibt, gilt eine Fair Use Policy.
Was verbraucht besonders viele Tokens?
Nicht alle Anfragen sind gleich teuer. Zwei Faktoren fallen besonders ins Gewicht:
Ultra- und Premium-Modelle wie z. B. Claude Opus oder GPT-5.5 kosten pro Anfrage deutlich mehr als schlankere Modelle. Wer ausschließlich mit diesen Modellen arbeitet, erreicht das Limit entsprechend schneller.
Deep Research führt im Hintergrund viele Einzelanfragen durch und verbraucht daher pro Durchlauf besonders viele Tokens — das summiert sich schnell.
Was passiert, wenn das Limit erreicht wird?
innoGPT greift nicht sofort hart ein. Stattdessen gibt es gestufte Maßnahmen: Zunächst kann es zu einer temporären Ratenbegrenzung kommen. In einem nächsten Schritt werden rechenintensive Modelle vorübergehend eingeschränkt und auf ressourcenschonendere Alternativen umgeleitet. Bei dauerhafter Überschreitung meldet sich innoGPT aktiv, um gemeinsam einen passenderen Plan zu finden.
Tipp zur smarten Nutzung
Für einfache Aufgaben wie Textzusammenfassungen, kurze Antworten oder Standard-Recherchen reichen schlankere Modelle vollkommen aus. Ultra-Modelle solltest du gezielt für komplexe Anfragen einsetzen — so holst du das Maximum aus deinem Kontingent heraus.
Verfügbare Pläne & Modelle
Je nach Plan stehen dir unterschiedliche Modell-Kategorien zur Verfügung. Generell gilt: Je höher der Plan, desto leistungsstärkere (und rechenintensivere) Modelle sind freigeschaltet.
Welcher Plan enthält welche Modell-Kategorien?
Personal / Pro / Business / Partner / Family: Standard, Premium & Ultra
Go: nur Standard
Trial — 7 Tage Testphase: Standard
Modellübersicht (Stand: Mai 2026)
🔗 Immer aktuell auf der Website — alle Modelle inkl. Hosting-Region findest du unter innogpt.de/modelle
🟢 Standard-Modelle
OpenAI:
gpt-5,gpt-5-mini,gpt-5-nano,gpt-5.1,gpt-5.4-mini,gpt-5.4-nano,gpt-4o-mini,gpt-4.1-mini,gpt-4.1-nano,o1-mini,o3-mini,o4-miniAnthropic:
claude-4-5-haikuGoogle:
gemini-2.0-flash,gemini-2.5-flash,gemini-2.5-pro,gemini-3-flash-previewMistral:
mistral-large,mistral-small,devstral-2xAI:
grok-4-1-fast-reasoningDeepSeek:
deepseek-r1,deepseek-v3,deepseek-v3.2Meta:
llama-4-maverickPerplexity:
sonar-deep-researchMoonshot:
kimi-k2.5
🟡 Premium-Modelle
OpenAI:
gpt-5-codex,gpt-5.2,gpt-5.2-codex,gpt-5.3-codex,gpt-5.3-instant,gpt-5.4,gpt-4o,gpt-4.1,o1Anthropic:
claude-3-5-sonnet,claude-4-sonnet,claude-4-5-sonnet,claude-4-6-sonnetGoogle:
gemini-2.0-flash-thinking-mode,gemini-3-pro-preview,gemini-3.1-pro-previewxAI:
grok-3Cohere:
cohere-command-aPerplexity:
sonar-pro
🔴 Ultra-Modelle
OpenAI:
gpt-5.4-pro,gpt-5.5,gpt-5.5-proAnthropic:
claude-4-6-opus,claude-4-7-opus
Nutzungsumfang: Was bedeutet „unbegrenzte Nachrichten"?
innoGPT arbeitet nicht mit harten Nachrichten-Kontingenten pro Nutzer, sondern mit einem gepoolten Nutzungsbudget pro Workspace über alle User hinweg.
Was ist inklusive:
Standard-Nachrichten
Was wird separat abgerechnet:
API-Nutzung
Add-Ons wie PII, Videos, Podcasts
Wie funktioniert das Workspace-Budget?
Teure Modelle (Premium-/Reasoning-Modelle) verbrauchen mehr Budget pro Anfrage
Günstige Modelle verbrauchen entsprechend weniger
Bei Erreichen des Budgets greift ein Soft Cap: Premium-Modelle werden eingeschränkt, Standard-Modelle bleiben uneingeschränkt verfügbar
💡 Was heißt das in der Praxis? Niemand „läuft trocken". Sobald das Premium-Budget aufgebraucht ist, können Nutzer mit den effizienteren Modellen nahtlos weiterarbeiten — kein Hard-Cutoff, kein blockierter Workflow.