Sprachmodelle und Tools - mehr Auswahl, mehr Verantwortung
27. September 2024
OpenAI o1 hat für Aufsehen gesorgt, denn es macht bei kniffligen Aufgaben seltener Fehler als GPT-4o. Ist es die nächste Evolutionsstufe der Sprachmodelle, so wie GPT-4 nach GPT-3.5 kam? Nicht unbedingt. OpenAI o1 ist das erste Sprachmodell in ChatGPT, das wir gezielt in bestimmten Szenarien einsetzen können, während es in anderen Bereichen besser ist, darauf zu verzichten.
Ablösen oder ergänzen?
Als GPT-4 vor eineinhalb Jahren den ChatGPT-Nutzer*innen bereitgestellt wurde, war die Wahl klar: Alle mit Pro-Lizenz ließen GPT-3.5 hinter sich. In Workshops nutzten wir GPT-3.5, um zu zeigen, dass sich die Pro-Lizenz lohnt. Die Alternativen von Google und Meta überzeugten nie so sehr, dass wir einen Umstieg erwogen oder sie in Projekten empfahlen. Wir probierten sie aus und legten sie beiseite. Das änderte sich erst, als Claude in Europa verfügbar wurde. Claude erweist sich beim Texten als kreativer und eleganter als ChatGPT und ist für manche Marketingaufgaben die erste Wahl.
Perplexity galt lange als Geheimtipp für Recherche. Es konnte schon früh Quellen angeben und machte die Überprüfung seiner Ergebnisse auf Halluzinationen einfach. Wir konnten sofort sehen, was auf den referenzierten Websites steht. Zwar minderte diese Methode die Leistung des Tools - hier von Sprachmodell zu sprechen, wäre ja falsch - aber die Recherche selbst und die Darstellung der Ergebnisse spart viel Zeit. Falsche Zusammenfassungen gab es kaum, weshalb sich Perplexity immer mehr als Alternative zur Google-Suche etabliert hat.
Parallel blieb DeepL die unangefochtene Nummer eins für Übersetzungen. In puncto Benutzerfreundlichkeit ist DeepL den anderen Tools weit voraus.
Wann o1, wann GPT-4o?
Als OpenAI o1 noch Strawberry hieß, erwarteten wir, dass es GPT-4o ablöst. OpenAI traut uns aber mehr zu. Wir können innerhalb des Chatbots passend zu unseren Aufgaben das geeignete Sprachmodell wählen. Für alle mathematischen, Programmierungs- und Denkaufgaben gibt es das neue OpenAI o1. Hier ist das Prompten einfacher geworden, da das Sprachmodell ohne Chain-of-Thought (CoT) auskommt, also ohne lange Anweisungen, die ihm die Problemlösung vorgeben. OpenAI hat dazu bereits eine kurze Anleitung veröffentlicht. Für alle übrigen Aufgaben ist GPT-4o nach wie vor die bessere Wahl, vor allem, weil mit diesem Modell Funktionen wie Datei-Uploads, Bildgenerierung und die Verwendung von Custom GPTs in Chats unterstützt werden.
Was heißt das für uns? GPT-4o bleibt das Sprachmodell der Wahl für die meisten Aufgaben, während o1 sich immer dann anbietet, wenn eine Antwort durchdacht werden muss. Das ist eine spannende Neuerung, die uns mehr Optionen bietet, aber auch einen bewussten Umgang mit den Sprachmodellen und den verschiedenen Prompting-Techniken erfordert.
Weder Chatbots noch Sprachmodelle lösen einander ab. Vielmehr gilt es, das passende Tool und Modell für jede Aufgabe zu wählen. Für kreative Textarbeiten bevorzugen wir vielleicht Claude, während wir für detaillierte Recherchen Perplexity heranziehen. ChatGPT bietet uns die Möglichkeit, zwischen GPT-4o und o1 zu wechseln – je nachdem, welches Modell unsere spezifischen Anforderungen am besten erfüllt.
Ist das die Zukunft? Ja und nein. Dass sich unter den unzähligen KI-Tools solche herauskristallisieren, die den Status von Word oder Excel erreichen, ist zu erwarten. Dass wir überlegen müssen, wofür wir was einsetzen, eher nicht. Das wird dann irgendwann so selbstverständlich werden wie bei den Office-Anwendungen.