Zurück

GPT-4o - was so ein "o" alles kann

13. Mai 2024

Heute hat OpenAI das neue Sprachmodell GPT-4o vorgestellt. Technisch ist es beeindruckend, denn es kann Text, Bilder und Sprache verarbeiten – ein echtes multimodales Modell. Doch die eigentliche Neuigkeit ist, dass es in der kostenlosen Version von ChatGPT verfügbar ist.

Demokratisierung der KI-Nutzung

OpenAI behält die unterschiedlichen ChatGPT-Versionen bei, aber sie unterscheiden sich nicht mehr im Sprachmodell. Das bedeutet:

  • Kostenlos: ChatGPT ist weit verbreitet, doch die meisten nutzen die kostenlose Version mit dem älteren und weniger leistungsfähigen Sprachmodell GPT-3.5. Jetzt kommen diese Nutzer*innen in den Genuss von GPT-4o und werden einen großen Qualitätsschub erleben.
  • ChatGPT Plus: Einige, die für ChatGPT Plus bezahlen, können sich zukünftig die Kosten sparen, da es kein exklusives Sprachmodell mehr gibt. Auch Funktionen wie Advanced Data Analytics, Web Browsing und der Zugang zu GPTs sind nicht mehr exklusiv. Lediglich DALL-E bleibt in Plus enthalten und ist in der kostenlosen Variante nicht verfügbar. Die Versionen unterscheiden sich also nur noch in der Anzahl der möglichen Prompts und dem Umfang, in dem die  Funktionen genutzt werden können. Was das konkret heißt, wird sich in der Praxis zeigen.
  • Datenschutz: Wer ausschließt, dass ChatGPT die eigenen Eingaben zu Trainingszwecken nutzt, verliert seine Historie nicht mehr. Damit geht ein Grund verloren, ChatGPT Team zu nutzen. Das zentrale Argument für diese Version bleibt jedoch bestehen: Hier ist voreingestellt, dass die Eingaben und Ausgaben nicht für das Training verwendet werden dürfen. Bei der kostenlosen Version und ChatGPT Plus müssen die Nutzer*innen diese Einstellung selbst vornehmen. Darauf werden sich IT-Abteilungen kaum verlassen.

Das weltweite Rollout verlief schneller als erwartet. Schon am gleichen Abend berichteten die ersten Nutzer*innen aus Deutschland, dass sie Zugang zum neuen Sprachmodell haben. Wir waren am nächsten Morgen dran.

Die freundliche Gesprächspartnerin

Wirklich neu ist nichts und doch ist alles neu. So ist der erste Eindruck von ChatGPT. Es fühlt sich an wie eine freundliche Gesprächspartnerin. Hier sind einige Gründe:

  • Einmal mit alles: GPT-4o kann Text, Bilder und Sprache verarbeiten. Das konnte ChatGPT vorher auch, aber mit verschiedenen Modellen. Jetzt ist alles in einem Modell vereint. Das Ergebnis? Eine ganz neue Nutzererfahrung. Wir können wie gewohnt schreiben, aber auch sprechen und Bilder austauschen. Alles wirkt viel natürlicher.
  • Hört mal, wer da spricht: ChatGPT kann jetzt nicht nur antworten, sondern auch verschiedene Stimmen und Stimmungen annehmen. In der Demo schlüpft es in die Rollen einer Märchenerzählerin und einer Sängerin. Und wir können ChatGPT unterbrechen, wenn es nicht das tut, was wir wollen – das spart Zeit, auch wenn es nicht die höflichste Methode ist. Übrigens, das Ganze funktioniert in etwa 50 Sprachen und ermöglicht so Gespräche zwischen verschiedensprachigen Akteur*innen.
  • Ich sehe was, was du nicht siehst: Das gehört der Vergangenheit an. Auf dem Mac oder dem iPhone (Windows-Nutzer*innen müssen noch etwas warten) kann ChatGPT sehen, was wir auf unserem Bildschirm machen und uns dabei unterstützen. Ein Beispiel zeigt, wie praktisch das ist.
     

Wir haben diesen Beitrag im Laufe der Woche bereits zweimal überarbeitet und werden ihn ergänzen, wenn neue Informationen auftauchen. Falls wir selbst etwas nicht gleich mitbekommen – wir freuen uns über Hinweise.

Mehr lesen