Technischer Leitfaden

Sichtbarkeit in der KI-Suche: Von ChatGPT zitiert werden

R
Rogue AI
··11 Min. Lesezeit

Ein wachsender Teil der Menschen, die suchen, was Sie anbieten, sieht überhaupt keine Liste blauer Links mehr. Sie stellen ChatGPT, Perplexity oder Googles AI Overview eine Frage und lesen die Antwort, die daraus synthetisiert wird. Wenn Ihre Website nicht zu den Quellen gehört, aus denen diese Antwort gebaut ist, sind Sie für diese Menschen unsichtbar — egal, wie gut Sie in der klassischen Suche ranken. Generative Engine Optimization (GEO) ist die Disziplin, die Quelle zu sein, die das Modell zitiert. Dieser Leitfaden zeigt, was diese Kennzahl tatsächlich bewegt — aus der Arbeit, dieses Portfolio zitierbar zu machen.

GEO ist nicht SEO, aber es reimt sich

Klassisches SEO optimiert eine URL, damit sie in einer Liste von Links rankt. GEO optimiert Ihre Inhalte, damit sie abgerufen, als vertrauenswürdig eingestuft und innerhalb einer synthetisierten Antwort zitiert werden — einer Antwort, die womöglich gar keinen Link zeigt. Die Reise des Nutzers endet bei der Antwort, nicht auf Ihrer Seite — der Gewinn ist also, als Quelle genannt zu werden, nicht angeklickt zu werden.

Die meisten Grundlagen lassen sich übertragen. Der neue Teil ist schmal, aber real:

Übernommen aus SEO

Crawlbar, schnell, technisch sauber und autoritativ sein. Eine Seite, die eine Suchmaschine nicht indexieren kann, ist eine Seite, die eine Antwortmaschine nicht zitieren kann. Die Basisschicht ist dieselbe, die gutes SEO ohnehin baut.

Neu: Zitierbarkeit

Kann ein Modell eine korrekte, in sich geschlossene Aussage aus Ihrer Seite herauslösen, ohne den umgebenden Kontext? Ranking belohnt ganze Seiten; Zitation belohnt herauslösbare Sätze. Das ist nicht dasselbe Handwerk.

Neu: Maschinenzugang

KI-Crawler sind eine eigene Gruppe von User-Agents mit eigenen Regeln. Ob Sie in einer KI-Antwort auftauchen, entscheidet sich teils durch Zugriffsentscheidungen, die klassisches SEO nie treffen musste.

Schritt null: die richtigen KI-Crawler hereinlassen

Sie können nicht von einem System zitiert werden, das Sie nie lesen durfte. Aber „KI-Crawler" ist nicht eine Sache, und die Unterscheidung entscheidet, ob das Sperren eines Crawlers Sie still von einer Antwortoberfläche entfernt.

Trainings-Crawler — GPTBot, ClaudeBot, Google-Extended, CCBot

Sie sammeln Korpora für das Modelltraining. Sie zu sperren ist eine Lizenzentscheidung darüber, ob Ihr Text künftige Modelle trainiert — nicht für sich genommen eine Entscheidung darüber, ob Sie in den heutigen Antworten auftauchen.

Retrieval-Crawler — OAI-SearchBot, PerplexityBot, ChatGPT-User

Diese rufen Live-Seiten ab, um gerade jetzt die Frage eines Nutzers zu beantworten. Sperren Sie sie, und Sie verzichten darauf, in der ChatGPT-Suche und in Perplexity zitiert zu werden. Das ist die Gruppe, die die meisten Websites versehentlich aussperren.

Die Google-Feinheit, die die meisten falsch verstehen

Googles AI Overviews werden aus dem normalen Googlebot-Index bedient. Google-Extended zu sperren steuert nur das Gemini-Training — es entfernt Sie nicht aus den AI Overviews. Wenn Sie von Google indexiert sind, sind Sie qualifiziert.

Entscheiden Sie pro Crawler. Übernehmen Sie kein pauschales Disallow aus einer kopierten Vorlage, und erlauben Sie nicht pauschal alles, ohne zu wissen, was jeder Agent tut. Eine bewusste Haltung sieht so aus:

# Die Retrieval-Crawler ausdrücklich einladen
User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

# Sensible Pfade für alle Agents sperren
User-agent: *
Disallow: /private/

Sitemap: https://example.com/sitemap.xml

Eine harte Regel liegt unter all dem: Was ein Crawler abrufen kann, kann er zitieren. Ein noindex-Tag hält eine Seite davon ab zu ranken — es hält einen Retrieval-Crawler nicht davon ab, sie abzurufen und in eine Antwort einzulesen. Soll eine Seite niemals zitiert werden, muss sie für diese Agents auf Pfadebene unerreichbar sein, nicht bloß deindexiert.

llms.txt: eine Karte, die Sie Sprachmodellen in die Hand geben

llms.txt ist eine aufkommende Konvention: eine einzelne Markdown-Datei im Wurzelverzeichnis Ihrer Website, die einem Modell einen sauberen, linkreichen Index dessen reicht, was Sie veröffentlichen und wo die kanonische Version jeder Sache liegt. Wo robots.txt einem Crawler sagt, was er nicht anfassen darf, sagt llms.txt ihm, was lesenswert ist und wie es zusammenhängt.

Das Muster, das funktioniert: Behandeln Sie llms.txt als navigatorischen Index — eine kurze Beschreibung plus gruppierte Links mit je einer einzeiligen Zusammenfassung — und ein optionales llms-full.txt als Volltext-Ergänzung, die den eigentlichen Inhalt für Modelle einbettet, die ihn in einem Abruf wollen.

Nur auflisten, was Sie zitiert sehen möchten

Das sind schlichte, abrufbare, KI-zugewandte Dateien. Eine Seite, die Sie aus gutem Grund aus Navigation und Sitemap heraushalten, dann aber aus llms.txt verlinken — oder in llms-full.txt einbetten — ist nicht mehr verborgen. Besonders die Volltext-Datei veröffentlicht erneut, was immer Sie ihr geben; halten Sie private oder identitätstragende Seiten aus beiden heraus.

So schreiben, dass ein Modell einen einzelnen Absatz herauslösen kann

Retrieval arbeitet mit Chunks, nicht mit ganzen Seiten. Das Modell zieht die wenigen Passagen, die zur Frage passen, und baut daraus eine Antwort. Ihre Aufgabe ist, jede Passage für sich korrekt und vollständig zu machen.

Antwort zuerst, dann ausführen

Beginnen Sie jeden Abschnitt mit der direkten Antwort in ein, zwei Sätzen, dann ergänzen Sie die Nuancen. Umgekehrte Pyramide. Ein Modell, das die Antwort in der ersten Zeile eines Chunks findet, zitiert diese Zeile.

In sich geschlossene Abschnitte

Vermeiden Sie „wie oben erwähnt" und Pronomen, die auf andere Absätze zeigen. Jeder Abschnitt sollte Sinn ergeben, wenn er komplett aus der Seite herausgelöst wird — denn genau das passiert mit ihm.

Konkrete, prüfbare Aussagen

„Dokumentenprüfung von zwei Stunden auf drei Minuten gesenkt" ist zitierbar; „deutlich schneller" nicht. Konkrete Zahlen, Daten und Namen geben einem Modell etwas, das es zuschreiben, und einem Leser etwas, das er prüfen kann.

Überschriften als Fragen, Vergleiche als Tabellen

Formulieren Sie Überschriften so, wie Menschen fragen — die Überschrift ist ein Retrieval-Signal. Stecken Sie Vergleiche in Tabellen und Listen; strukturierte Daten lassen sich sauberer extrahieren als dieselben Fakten, vergraben in Fließtext.

Strukturierte Daten sind maschinenlesbare Autorschaft

JSON-LD ändert nicht, was ein Mensch liest, aber es sagt einer Maschine, wer dies gesagt hat, wann und mit welcher Autorität — als Daten, nicht als etwas, das sie aus Ihrem Fließtext erschließen muss. Für GEO sind die wertvollen Typen wenige:

Organization oder Person — Ihre Identität

Eine Entität mit einer stabilen @id und einem sameAs-Array, das Ihre Profile verlinkt. Das ist es, was ein Modell Ihre Website, Ihr LinkedIn und Ihr GitHub als einen Autor behandeln lässt.

Article oder BlogPosting — Ihr Inhalt

Mit author, publisher, datePublished und dateModified. Aktualität und klare Autorschaft sind Signale, die eine Antwortmaschine abwägt, wenn sie entscheidet, wem sie vertraut.

speakable und FAQPage — die herauslösbaren Teile

speakable markiert die Passagen, die sich vorlesen lassen; FAQPage macht echte Frage-Antwort-Inhalte zu strukturierten Paaren, die ein Modell ganz herauslösen kann. Nutzen Sie sie, wo sie zutreffen, nicht als Dekoration.

Die wichtigste Disziplin hier ist Konsistenz: dieselbe kanonische @id für Ihre Entität auf jeder Seite. Drei Seiten, die drei verschiedene Identitäten behaupten, geben einem Modell nichts zum Zusammenführen. Eine Identität, wiederholt, summiert sich.

Autorität: eine Entität sein, nicht nur eine Seite

Antwortmaschinen neigen stark zu Quellen, die sie zuschreiben und denen sie vertrauen können — dieselben Signale für Erfahrung, Expertise, Autorität und Vertrauen, die die klassische Suche belohnt, gelesen von einer Maschine, die einen Namen zu einer Aussage stellen will. Die praktischen Schritte:

Versehen Sie Ihre Inhalte mit einer echten Autorenzeile und einer datierten, gepflegten Veröffentlichungshistorie. Verlinken Sie Ihre Profile konsistent, damit sameAs zu einer kohärenten Entität auflöst. Zitieren Sie Ihre eigenen Quellen — eine Seite, die ihre Arbeit zeigt, ist leichter zu vertrauen und zu zitieren als eine, die nur behauptet. Und seien Sie konkret darüber, was Sie tatsächlich getan haben; nachgewiesene, datierte Erfahrung ist das Signal, das kein noch so gutes Keyword-Tuning fälscht.

Etwas messen, das man nicht im Ranking verfolgen kann

In einer synthetisierten Antwort gibt es keine „Position drei", also lässt sich das alte Rank-Tracking-Spielbuch nicht übertragen. Stattdessen messen Sie GEO aus mehreren, verrauschteren Blickwinkeln:

Die Assistenten direkt fragen

Schicken Sie die Fragen, die Ihre Käufer stellen, regelmäßig durch ChatGPT, Perplexity und Gemini. Werden Sie genannt? Stimmt, was sie über Sie sagen? Das ist grob, aber es ist das Nächste an einem Live-Ranking.

Referral-Traffic von KI-Oberflächen beobachten

Zitationen tragen Links, und Klicks darauf erscheinen als Referrer von chatgpt.com, perplexity.ai und ähnlichen. Heute kleine Zahlen, aber die Trendlinie ist das Signal.

Ihre Server-Logs nach KI-User-Agents lesen

Rufen OAI-SearchBot und PerplexityBot Sie tatsächlich ab, wie oft und welche Seiten? Crawl-Aktivität ist der Frühindikator, der jeder Zitation überhaupt vorausgeht.

Marken- und Aussagen-Erwähnungen überwachen

Verfolgen Sie, wo Ihr Name und Ihre konkreten Aussagen im Web auftauchen — dem Korpus, aus dem Antwortmaschinen schöpfen. Mehr zutreffende Erwähnungen an mehr Stellen sind die vorgelagerte Ursache für mehr Zitationen.

Seien Sie ehrlich zu sich selbst über die Daten: Die Zuordnung ist hier 2026 wirklich unausgereift. Sie bekommen nicht die Präzision eines klassischen Analytics-Funnels, und wer Ihnen einen sauberen „KI-Sichtbarkeits-Score" verkauft, glättet diese Tatsache weg. Behandeln Sie die Zahlen als Richtung, nicht als Messuhr.

Wo man anfängt

Sie brauchen keine GEO-Plattform und kein neues Budget. Der erste Durchgang ist bewusst klein:

Eins. Setzen Sie Ihre Crawler-Haltung pro Agent in robots.txt, bewusst — erlauben Sie die Retrieval-Crawler, die Sie wollen, und sperren Sie die Pfade, die nicht zitiert werden sollen.

Zwei. Veröffentlichen Sie einen llms.txt-Index. Fügen Sie llms-full.txt nur mit Inhalten hinzu, die Sie wortwörtlich zitiert sehen möchten.

Drei. Schreiben Sie Ihre fünf wichtigsten Seiten um — Antwort zuerst, mit konkreten, in sich geschlossenen Aussagen und fragenförmigen Überschriften.

Vier. Fügen Sie JSON-LD mit einer stabilen Entitäts- @id und einem sameAs-Array hinzu, dazu Article-Markup mit echten Daten und Autor.

Fünf. Beobachten Sie Ihre Logs auf KI-Crawler-Treffer und stellen Sie den Assistenten einmal im Monat die Fragen Ihrer Käufer. Iterieren Sie über das, was sie falsch machen.

GEO ist 2026 früh dran, und genau das ist die Chance: Die Grundlagen sind unspektakulär, und die meisten Websites haben sie nicht gemacht. Seien Sie crawlbar, seien Sie zitierbar, seien Sie eine konsistente und datierte Entität — und Sie sind den Seiten, die noch allein für eine Liste von Links optimieren, die niemand liest, bereits voraus.

Weiterführend: LLM-Integration in Geschäftssysteme, Multi-Agenten-Orchestrierung, und warum die meisten KI-Projekte vor der Produktion scheitern.

Rogue AI • Production Systems •