Startseite / Blog / Technischer Leitfaden

Technischer Leitfaden

Sichtbarkeit in der KI-Suche: Von ChatGPT zitiert werden

RRogue AI·2026-05-22·11 Min. Lesezeit

Ein Quelldokument wird in ein KI-Antwortpanel zitiert, Generative Engine Optimization

Ein wachsender Teil der Menschen, die suchen, was Sie anbieten, sieht überhaupt keine Liste blauer Links mehr. Sie stellen ChatGPT, Perplexity oder Googles AI Overview eine Frage und lesen die Antwort, die daraus synthetisiert wird. Wenn Ihre Website nicht zu den Quellen gehört, aus denen diese Antwort gebaut ist, sind Sie für diese Menschen unsichtbar, egal, wie gut Sie in der klassischen Suche ranken. Generative Engine Optimization (GEO) ist die Disziplin, die Quelle zu sein, die das Modell zitiert, und dieser Leitfaden zeigt, was diese Kennzahl tatsächlich bewegt, aus der Arbeit, genau dieses Portfolio zitierbar zu machen.

GEO ist nicht SEO, aber es reimt sich

Klassisches SEO optimiert eine URL, damit sie in einer Liste von Links rankt. GEO optimiert Ihre Inhalte, damit sie abgerufen, als vertrauenswürdig eingestuft und innerhalb einer synthetisierten Antwort zitiert werden, einer Antwort, die womöglich gar keinen Link zeigt. Die Reise des Nutzers endet bei der Antwort, nicht auf Ihrer Seite, der Gewinn ist also, als Quelle genannt zu werden, nicht angeklickt zu werden.

Die meisten Grundlagen lassen sich übertragen. Der neue Teil ist schmal, aber real:

Übernommen aus SEO

Crawlbar, schnell, technisch sauber und autoritativ sein. Eine Seite, die eine Suchmaschine nicht indexieren kann, ist eine Seite, die eine Antwortmaschine nicht zitieren kann. Die Basisschicht ist dieselbe, die gutes SEO ohnehin baut.

Neu: Zitierbarkeit

Kann ein Modell eine korrekte, in sich geschlossene Aussage aus Ihrer Seite herauslösen, ohne den umgebenden Kontext? Ranking belohnt ganze Seiten; Zitation belohnt herauslösbare Sätze. Das ist nicht dasselbe Handwerk.

Neu: Maschinenzugang

KI-Crawler sind eine eigene Gruppe von User-Agents mit eigenen Regeln. Ob Sie in einer KI-Antwort auftauchen, entscheidet sich teils durch Zugriffsentscheidungen, die klassisches SEO nie treffen musste.

Schritt null: die richtigen KI-Crawler hereinlassen

Sie können nicht von einem System zitiert werden, das Sie nie lesen durfte. Aber „KI-Crawler" ist nicht eine Sache, und die Unterscheidung entscheidet, ob das Sperren eines Crawlers Sie still von einer Antwortoberfläche entfernt.

Trainings-Crawler, GPTBot, ClaudeBot, Google-Extended, CCBot

Sie sammeln Korpora für das Modelltraining. Sie zu sperren ist eine Lizenzentscheidung darüber, ob Ihr Text künftige Modelle trainiert, nicht für sich genommen eine Entscheidung darüber, ob Sie in den heutigen Antworten auftauchen.

Retrieval-Crawler, OAI-SearchBot, PerplexityBot, ChatGPT-User

Diese rufen Live-Seiten ab, um gerade jetzt die Frage eines Nutzers zu beantworten. Sperren Sie sie, und Sie verzichten darauf, in der ChatGPT-Suche und in Perplexity zitiert zu werden. Das ist die Gruppe, die die meisten Websites versehentlich aussperren.

Die Google-Feinheit, die die meisten falsch verstehen

Googles AI Overviews werden aus dem normalen Googlebot-Index bedient. Google-Extended zu sperren steuert nur das Gemini-Training, es entfernt Sie nicht aus den AI Overviews. Wenn Sie von Google indexiert sind, sind Sie qualifiziert.

Entscheiden Sie pro Crawler. Übernehmen Sie kein pauschales Disallow aus einer kopierten Vorlage, und erlauben Sie nicht pauschal alles, ohne zu wissen, was jeder Agent tut. Eine bewusste Haltung sieht so aus:

# Die Retrieval-Crawler ausdrücklich einladen
User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

# Sensible Pfade für alle Agents sperren
User-agent: *
Disallow: /private/

Sitemap: https://example.com/sitemap.xml

Eine harte Regel liegt unter all dem: Was ein Crawler abrufen kann, kann er zitieren. Ein noindex-Tag hält eine Seite davon ab zu ranken, es hält einen Retrieval-Crawler nicht davon ab, sie abzurufen und in eine Antwort einzulesen. Soll eine Seite niemals zitiert werden, muss sie für diese Agents auf Pfadebene unerreichbar sein, nicht bloß deindexiert.

llms.txt: eine Karte, die Sie Sprachmodellen in die Hand geben

llms.txt ist eine aufkommende Konvention: eine einzelne Markdown-Datei im Wurzelverzeichnis Ihrer Website, die einem Modell einen sauberen, linkreichen Index dessen reicht, was Sie veröffentlichen und wo die kanonische Version jeder Sache liegt. Wo robots.txt einem Crawler sagt, was er nicht anfassen darf, sagt llms.txt ihm, was lesenswert ist und wie es zusammenhängt.

Das Muster, das funktioniert: Behandeln Sie llms.txt als navigatorischen Index, eine kurze Beschreibung plus gruppierte Links mit je einer einzeiligen Zusammenfassung, und ein optionales llms-full.txt als Volltext-Ergänzung, die den eigentlichen Inhalt für Modelle einbettet, die ihn in einem Abruf wollen.

Nur auflisten, was Sie zitiert sehen möchten

Das sind schlichte, abrufbare, KI-zugewandte Dateien. Eine Seite, die Sie aus gutem Grund aus Navigation und Sitemap heraushalten, dann aber aus llms.txt verlinken, oder in llms-full.txt einbetten, ist nicht mehr verborgen. Besonders die Volltext-Datei veröffentlicht erneut, was immer Sie ihr geben; halten Sie private oder identitätstragende Seiten aus beiden heraus.

So schreiben, dass ein Modell einen einzelnen Absatz herauslösen kann

Retrieval arbeitet mit Chunks, nicht mit ganzen Seiten. Das Modell zieht die wenigen Passagen, die zur Frage passen, und baut daraus eine Antwort. Ihre Aufgabe ist, jede Passage für sich korrekt und vollständig zu machen.

Antwort zuerst, dann ausführen

Beginnen Sie jeden Abschnitt mit der direkten Antwort in ein, zwei Sätzen, dann ergänzen Sie die Nuancen. Umgekehrte Pyramide. Ein Modell, das die Antwort in der ersten Zeile eines Chunks findet, zitiert diese Zeile.

In sich geschlossene Abschnitte

Vermeiden Sie „wie oben erwähnt" und Pronomen, die auf andere Absätze zeigen. Jeder Abschnitt sollte Sinn ergeben, wenn er komplett aus der Seite herausgelöst wird, denn genau das passiert mit ihm.

Konkrete, prüfbare Aussagen

„Dokumentenprüfung von zwei Stunden auf drei Minuten gesenkt" ist zitierbar; „deutlich schneller" nicht. Konkrete Zahlen, Daten und Namen geben einem Modell etwas, das es zuschreiben, und einem Leser etwas, das er prüfen kann.

Überschriften als Fragen, Vergleiche als Tabellen

Formulieren Sie Überschriften so, wie Menschen fragen, die Überschrift ist ein Retrieval-Signal. Stecken Sie Vergleiche in Tabellen und Listen; strukturierte Daten lassen sich sauberer extrahieren als dieselben Fakten, vergraben in Fließtext.

Strukturierte Daten sind maschinenlesbare Autorschaft

JSON-LD ändert nicht, was ein Mensch liest, aber es sagt einer Maschine, wer dies gesagt hat, wann und mit welcher Autorität, als Daten, nicht als etwas, das sie aus Ihrem Fließtext erschließen muss. Für GEO sind die wertvollen Typen wenige:

Organization oder Person, Ihre Identität

Eine Entität mit einer stabilen @id und einem sameAs-Array, das Ihre Profile verlinkt. Das ist es, was ein Modell Ihre Website, Ihr LinkedIn und Ihr GitHub als einen Autor behandeln lässt.

Article oder BlogPosting, Ihr Inhalt

Mit author, publisher, datePublished und dateModified. Aktualität und klare Autorschaft sind Signale, die eine Antwortmaschine abwägt, wenn sie entscheidet, wem sie vertraut.

speakable und FAQPage, die herauslösbaren Teile

speakable markiert die Passagen, die sich vorlesen lassen; FAQPage macht echte Frage-Antwort-Inhalte zu strukturierten Paaren, die ein Modell ganz herauslösen kann. Nutzen Sie sie, wo sie zutreffen, nicht als Dekoration.

Die wichtigste Disziplin hier ist Konsistenz: dieselbe kanonische @id für Ihre Entität auf jeder Seite. Drei Seiten, die drei verschiedene Identitäten behaupten, geben einem Modell nichts zum Zusammenführen. Eine Identität, wiederholt, summiert sich.

Autorität: eine Entität sein, nicht nur eine Seite

Antwortmaschinen neigen stark zu Quellen, die sie zuschreiben und denen sie vertrauen können, dieselben Signale für Erfahrung, Expertise, Autorität und Vertrauen, die die klassische Suche belohnt, gelesen von einer Maschine, die einen Namen zu einer Aussage stellen will. Die praktischen Schritte:

Versehen Sie Ihre Inhalte mit einer echten Autorenzeile und einer datierten, gepflegten Veröffentlichungshistorie. Verlinken Sie Ihre Profile konsistent, damit sameAs zu einer kohärenten Entität auflöst. Zitieren Sie Ihre eigenen Quellen, eine Seite, die ihre Arbeit zeigt, ist leichter zu vertrauen und zu zitieren als eine, die nur behauptet. Und seien Sie konkret darüber, was Sie tatsächlich getan haben; nachgewiesene, datierte Erfahrung ist das Signal, das kein noch so gutes Keyword-Tuning fälscht.

Etwas messen, das man nicht im Ranking verfolgen kann

In einer synthetisierten Antwort gibt es keine „Position drei", also lässt sich das alte Rank-Tracking-Spielbuch nicht übertragen. Stattdessen messen Sie GEO aus mehreren, verrauschteren Blickwinkeln:

Die Assistenten direkt fragen

Schicken Sie die Fragen, die Ihre Käufer stellen, regelmäßig durch ChatGPT, Perplexity und Gemini. Werden Sie genannt? Stimmt, was sie über Sie sagen? Das ist grob, aber es ist das Nächste an einem Live-Ranking.

Referral-Traffic von KI-Oberflächen beobachten

Zitationen tragen Links, und Klicks darauf erscheinen als Referrer von chatgpt.com, perplexity.ai und ähnlichen. Heute kleine Zahlen, aber die Trendlinie ist das Signal.

Ihre Server-Logs nach KI-User-Agents lesen

Rufen OAI-SearchBot und PerplexityBot Sie tatsächlich ab, wie oft und welche Seiten? Crawl-Aktivität ist der Frühindikator, der jeder Zitation überhaupt vorausgeht.

Marken- und Aussagen-Erwähnungen überwachen

Verfolgen Sie, wo Ihr Name und Ihre konkreten Aussagen im Web auftauchen, dem Korpus, aus dem Antwortmaschinen schöpfen. Mehr zutreffende Erwähnungen an mehr Stellen sind die vorgelagerte Ursache für mehr Zitationen.

Seien Sie ehrlich zu sich selbst über die Daten: Die Zuordnung ist hier 2026 wirklich unausgereift. Sie bekommen nicht die Präzision eines klassischen Analytics-Funnels, und wer Ihnen einen sauberen „KI-Sichtbarkeits-Score" verkauft, glättet diese Tatsache weg. Behandeln Sie die Zahlen als Richtung, nicht als Messuhr.

Wo man anfängt

Sie brauchen keine GEO-Plattform und kein neues Budget. Der erste Durchgang ist bewusst klein:

Eins. Setzen Sie Ihre Crawler-Haltung pro Agent in robots.txt, bewusst, erlauben Sie die Retrieval-Crawler, die Sie wollen, und sperren Sie die Pfade, die nicht zitiert werden sollen.

Zwei. Veröffentlichen Sie einen llms.txt-Index. Fügen Sie llms-full.txt nur mit Inhalten hinzu, die Sie wortwörtlich zitiert sehen möchten.

Drei. Schreiben Sie Ihre fünf wichtigsten Seiten um, Antwort zuerst, mit konkreten, in sich geschlossenen Aussagen und fragenförmigen Überschriften.

Vier. Fügen Sie JSON-LD mit einer stabilen Entitäts- @id und einem sameAs-Array hinzu, dazu Article-Markup mit echten Daten und Autor.

Fünf. Beobachten Sie Ihre Logs auf KI-Crawler-Treffer und stellen Sie den Assistenten einmal im Monat die Fragen Ihrer Käufer. Iterieren Sie über das, was sie falsch machen.

GEO ist 2026 früh dran, und genau das ist die Chance: Die Grundlagen sind unspektakulär, und die meisten Websites haben sie noch nicht gemacht. Seien Sie crawlbar, seien Sie zitierbar, seien Sie eine konsistente und datierte Entität, und Sie sind jeder Seite, die noch allein für eine Liste von Links optimiert, die niemand liest, bereits voraus.

Weiterführend: LLM-Integration in Geschäftssysteme, Multi-Agenten-Orchestrierung, und warum die meisten KI-Projekte vor der Produktion scheitern.

Kurzreferenz

KI-Crawler-Zugang, wer Ihre Seite abruft und wo sie auftaucht

Engine	Retrieval-User-Agent (Live-Abruf)	Trainings-User-Agent (Korpus)	Zitations-Oberfläche
ChatGPT Web	OAI-SearchBot, ChatGPT-User	GPTBot	Quellen-Pills unter der Antwort
Perplexity	PerplexityBot	(derselbe Crawler)	Nummerierte Zitations-Karten inline
Claude Web	ClaudeBot	Anthropic-AI	Inline-Links in der Antwort
Google AI Overviews	Googlebot (Standard-Index)	Google-Extended (nur Gemini-Training)	Eingeklappte Quellenliste, paraphrasiert häufig
Bing Copilot	Bingbot	(derselbe Crawler)	Nummerierte Zitate in der Seitenleiste
Apple Intelligence	Applebot-Extended	(derselbe UA)	Zitate in KI-Funktionen und On-Device-Zusammenfassungen

Zitations-Verhalten nach Plattform, qualitative Stufen, beobachtet 2025

Plattform	Zitations-Dichte	Tendenz zu wörtlichen Zitaten	Praktischer Hinweis
Perplexity	Am höchsten, fast jede Antwort führt Quellen	Mittel bis hoch, kurze wörtliche Passagen	Lohnendste Oberfläche, um damit anzufangen
ChatGPT Search	Hoch, Browse-Modus zitiert konsistent	Mittel, paraphrasiert mit verlinkten Pills	Zitations-Rate stieg 2025 deutlich an
Bing Copilot	Mittel bis hoch, Seitenleiste zeigt immer Quellen	Mittel, nummerierte Referenzen	Enge Verzahnung mit dem Bing-Index
Claude Web-Suche	Mittel, zitiert beim Abruf von Live-URLs	Niedrig bis mittel, eher Links als wörtliche Zitate	Neuere Oberfläche; Verhalten entwickelt sich
Google AI Overviews	Niedriger, paraphrasiert oft ohne erkennbaren Link-Out	Niedrig, Quellen werden häufig aggregiert	Klassisches Google-Ranking bestimmt weiterhin die Sichtbarkeit

Häufig gestellte Fragen

Was ist Generative Engine Optimization (GEO)?

GEO ist die Disziplin, Ihre Inhalte so zu gestalten, dass sie aus den synthetisierten Antworten von KI-Engines wie ChatGPT, Perplexity und Google AI Overviews extrahierbar, vertrauenswürdig und zitierbar sind, statt nur in einer Liste blauer Links zu erscheinen. Die Grundlagen überlappen mit SEO (Crawlbarkeit, Tempo, Autorität), aber der Gewinn ist anders: Ranking belohnt ganze Seiten, Zitation belohnt in sich geschlossene Passagen, die ein Modell allein heraushebt.

Wie unterscheiden sich KI-Crawler vom Googlebot?

KI-Crawler teilen sich in zwei Familien. Trainings-Crawler (GPTBot, ClaudeBot, Google-Extended, CCBot) sammeln Korpora für das Modelltraining. Retrieval-Crawler (OAI-SearchBot, PerplexityBot, ChatGPT-User) rufen Live-Seiten ab, um die aktuelle Frage eines Nutzers zu beantworten. Einen Trainings-Crawler zu sperren ist eine Lizenzfrage; einen Retrieval-Crawler zu sperren entfernt Sie aus der heutigen Antwort dieser Engine. Googlebot bleibt der Standard-Index, der auch die Google AI Overviews speist.

Verhindert noindex KI-Crawler?

Nein. Das noindex-Meta-Tag hält eine Seite davon ab, in Suchergebnissen zu erscheinen, Retrieval-Crawler können sie aber weiterhin abrufen, lesen und in eine KI-Antwort einlesen. Soll eine Seite niemals von einer KI-Engine zitiert werden, muss sie auf Pfadebene in der robots.txt gesperrt sein, und sie darf nirgendwo verlinkt sein, wo ein Crawler sie entdecken würde: nicht in llms.txt, nicht im Sitemap, nicht in der Navigation, und nicht in JSON-LD-Autor- oder Publisher-URLs.

Was ist llms.txt?

llms.txt ist eine aufkommende Konvention: eine einzelne Markdown-Datei im Wurzelverzeichnis Ihrer Website, die Sprachmodellen einen sauberen, linkreichen Index dessen reicht, was Sie veröffentlichen. Behandeln Sie sie als navigatorischen Index, kurze Beschreibung plus gruppierte Links mit je einer einzeiligen Zusammenfassung. Eine optionale Begleitdatei llms-full.txt bettet den Volltext dieser Seiten ein, für Modelle, die alles in einem Abruf wollen. Alles, was Sie in einer dieser Dateien auflisten, ist Inhalt, den Sie wörtlich zitiert sehen möchten.

Sollte ich GPTBot sperren, um meine Inhalte zu schützen?

Entscheiden Sie bewusst, nicht reflexhaft. GPTBot zu sperren hält Ihren Text aus dem Trainingskorpus für zukünftige OpenAI-Modelle heraus, eine Lizenzentscheidung. Es entfernt Sie nicht aus den heutigen ChatGPT-Antworten, die vom separaten Retrieval-Crawler OAI-SearchBot bedient werden. Die meisten Websites sperren versehentlich beide, weil sie nur Googlebot zulassen, die GEO-Bewegung ist, jede Wahl pro User-Agent bewusst zu treffen.

Wie misst man GEO ohne eine Ranking-Position?

Stellen Sie die Fragen Ihrer Käufer regelmäßig ChatGPT, Perplexity und Gemini und notieren Sie, ob Sie genannt werden. Beobachten Sie Ihre Analytics nach Referrer-Traffic von chatgpt.com, perplexity.ai, copilot.microsoft.com und ähnlichen. Lesen Sie Ihre Server-Logs nach KI-Crawler-User-Agents, Crawl-Aktivität ist der Frühindikator, der jeder Zitation vorausgeht. Behandeln Sie die Zahlen als Richtung, nicht als Präzision; das KI-Attributions-Tooling ist 2026 echt noch unreif.