Von SEO zu GEO - Teil 2
18. August 2025
Im ersten Teil dieser Serie haben wir GEO als Weiterentwicklung von SEO beschrieben – mit der Reference Rate als neuer Kennzahl. Doch wie lässt sich diese neue Form der Sichtbarkeit überhaupt messen?
Die vier zentralen Metriken
Klassisches SEO war lange eindimensional: Rankings, Klicks, Traffic. GEO dagegen ist mehrdimensional. Sichtbarkeit bedeutet nicht mehr nur oben stehen, sondern auftauchen – im richtigen Kontext, an der richtigen Stelle, mit der richtigen Tonalität. Vier Metriken sind dabei entscheidend:
- Frequenz (Mentions): Wie oft erscheint eine Marke in Antworten von KI-Systemen? Das ist die Basis, um einen Share of Voice zu berechnen. Häufige Erwähnungen zeigen, dass die KI ein Unternehmen oder Produkt regelmäßig für relevant hält.
- Position: An welcher Stelle im Antworttext taucht die Marke auf? Ganz vorn in einer Empfehlungsliste, mittig als Option oder nur in einem Nebensatz? Bei Google AI Overviews etwa erscheinen Quellen meist unterhalb des generierten Absatzes – kaum sichtbar für flüchtige Nutzer*innen. Perplexity hingegen arbeitet mit hochgestellten Ziffern, die sofort auf konkrete Quellen verweisen. Ob die Marke in diesen ersten Referenzen auftaucht, entscheidet maßgeblich über die Wahrnehmung.
- Sentiment: In welchem Tonfall werden wir genannt? Positiv („hervorragender Service“), neutral („ein Anbieter von…“) oder negativ („Probleme in der Zuverlässigkeit“)? Diese Tonalität wird messbar, wenn KI-Antworten systematisch ausgewertet werden – und sie prägt, wie Nutzer*innen Marken wahrnehmen, bevor sie überhaupt die Website besuchen.
- Attribution (Citations): Wird die Quelle klar genannt oder verlinkt? ChatGPT und Claude liefern oft nur Mentions, ohne eine Domain anzugeben. Google AI Overviews und Perplexity hingegen verlinken direkt auf Quellen – ein entscheidender Unterschied, weil so trotz Zero-Click-Antworten noch Traffic entstehen kann.
Unterschiede zwischen den Plattformen
Die Gewichtung dieser Metriken ist je nach Engine unterschiedlich:
- Google (AI Overviews): Die KI fasst Inhalte zusammen und blendet Quellen als Dropdowns oder kleine Links ein. Nutzer*innen müssen aktiv klicken, um die Ursprungsseiten zu sehen. Für GEO heißt das: Sichtbarkeit gibt es auch ohne Klicks – aber Attribution ist oft schwach.
- Perplexity: Hier ist Attribution zentral. Jede Antwort enthält mehrere hochgestellte Quellenangaben. Spannend ist, dass Perplexity mit manuell gepflegten Autoritätslisten arbeitet: Für Entwickler-Content zählen GitHub oder Stack Overflow, für E-Commerce Amazon oder eBay, für Kommunikation Plattformen wie WhatsApp oder Discord. Auch Tools wie Notion oder Figma gelten per se als vertrauenswürdig und erhalten wie die Inhalte der anderen genannten Domains einen Bewertungsbonus. Zusätzlich prüft ein dreistufiges System die Qualität – wer den Schwellenwert nicht erfüllt, fliegt gleich aus den Ergebnissen. Und: Neue Inhalte haben nur ein kurzes Launch Window von wenigen Stunden, in dem sie ausreichend Klicks und Interaktionen erzielen müssen, sonst verlieren sie sofort an Sichtbarkeit.
- ChatGPT und Claude: Beide Modelle nennen Marken oft ohne Quellenangabe. Hier zählt vor allem, ob Inhalte im Trainingskorpus vorkommen oder über Webzugriffe gefunden werden. Attribution ist schwach, Mentions dagegen häufig – allerdings kaum messbar ohne spezielle Tests.
Diese Unterschiede zeigen: GEO ist kein Einheitskonzept. Wer nur eine Metrik misst, bekommt ein schiefes Bild.
Wie sich Sichtbarkeit messen lässt
Da KI-Suchsysteme eine Blackbox sind, braucht es neue Methoden, um diese Metriken greifbar zu machen. Typisch ist das Arbeiten mit synthetischen Prompts: Tausende Anfragen wie „beste Event-Agentur für Aktionärsversammlungen in München“ oder „welcher Lieferant von Lenovo-Notebooks ist auf den Mittelstand in NRW spezialisiert“ werden an ChatGPT, Claude, Gemini oder Perplexity geschickt. Anschließend wird systematisch ausgewertet, ob die eigene Marke genannt wird, in welcher Position, mit welchem Sentiment und ob eine Attribution vorhanden ist.
Einige Anbieter professionalisieren dieses Vorgehen: Die New Yorker Agentur Profound berechnet beispielsweise einen täglichen Share of Voice-Index, indem sie mehr als 300.000 Testanfragen in zehn Sprachen versendet und die Antworten auswertet.
Warum diese Metriken entscheidend sind
Für Unternehmen bedeutet das: GEO-Erfolg lässt sich nicht mehr an Klickzahlen allein ablesen. Entscheidend ist, ob die Marke in den relevanten Antworten auftaucht – und wie. Eine Marke, die oft erwähnt wird, aber ohne Attribution oder in negativem Kontext, gewinnt nichts. Umgekehrt kann schon eine einzige prominente Nennung mit positivem Sentiment enormen Einfluss haben. Die Herausforderung liegt darin, diese Dimensionen laufend zu beobachten. Erst die Kombination aus Frequenz, Position, Sentiment und Attribution ergibt ein realistisches Bild der eigenen Sichtbarkeit in der KI-Suche.
Was wir mit den Ergebnissen dieser Messungen anstellen, sehen wir uns Im nächsten Teil an.