Springe zum Inhalt

Was ist ein Generative Pretrained Transformer (GPT)?

Ein wichtiger Teilbereich der Künstlichen Intelligenz (KI) ist das Maschinelle Lernen. Normalerweise muss man einem Computer genau sagen, was er tun soll. Beim Maschinellen Lernen ist das jedoch anders: Der Computer erhält viele Beispiele und „lernt“ daraus, was zu tun ist, ohne dass ihm jedes Detail erklärt wird. Zeigt man einem Computer Tausende Bilder von Katzen und Hunden, kann er nach einer Weile selbst erkennen, ob auf einem neuen Bild eine Katze oder ein Hund zu sehen ist. Hinter diesem Lernprozess steht komplexe Mathematik. Beim Maschinellen Lernen lernt also der Computer aus Beispielen, wie er eine Aufgabe immer besser machen kann.

Ein konkretes Beispiel für Maschinelles Lernen sind Spamfilter für E-Mails. Der Spamfilter lernt anhand von vielen E-Mails, welche Mails wahrscheinlich Spam sind und welche nicht. Wenn viele Mails das Wort „Gewinn“ enthalten und am Ende nie etwas Gutes kommt, dann merkt der Computer: „Aha, das ist vielleicht Spam.“ Mit der Zeit wird der Spamfilter besser, weil er mehr E-Mails sieht und daraus lernt. Zusätzlich bekommen solche Programme Rückmeldungen von Benutzern, wenn diese Spam-Mails in ihrer Mailbox markieren.

Wie funktioniert ein Generative Pretrained Transformer (GPT)?

Ein GPT ist ein Programm, das Texte schreiben kann, als wäre es ein Mensch. Es funktioniert, indem es vorher riesige Mengen von Texten liest und daraus lernt, wie Sprache aufgebaut ist. Der Computer erkennt die Sprachmuster, wie Sätze gebildet werden und wie die Grammatik in der jeweiligen Sprache funktioniert.

Das Programm wird darauf trainiert, das nächste Wort in einem Satz vorherzusagen. Zum Beispiel, wenn der Satz mit „Ich bestreiche“ beginnt, weiß ein GPT, dass nach „bestreiche“ wahrscheinlich „das“ und danach „Brot“ kommt, weil er das in vielen Texten gesehen hat. Danach könnte dann „mit Butter.“ kommen. Indem er ständig ermittelt, welches Wort das nächst wahrscheinliche ist, kann er ganze Sätze und Absätze schreiben, die Sinn ergeben. In der Praxis kann man das mit ChatGPT ausprobieren:

Ergänze folgenden Satz: "Ich bestreiche"
ChatGPT:
ChatGPT

"Ich bestreiche das Brot mit Butter."

Das Besondere an einem GPT ist, dass er nicht nur stur Sätze auswendig lernt, sondern dass er versteht, wie die Wörter zusammenhängen. Dadurch kann man ihn für viele Aufgaben verwenden, wie das Beantworten von Fragen, das Schreiben von Geschichten oder das Erklären von Themen.

Allerdings – und das ist wichtig zu wissen – versteht ein GPT nicht wirklich, worüber er schreibt. Er erkennt nur Muster in der Sprache und ermittelt Wahrscheinlichkeiten. Man hat es also nicht mit einem Menschen zu tun, der bewusst eine Antwort überlegt und ausformuliert.

Wofür werden GPT verwendet und welche Herausforderungen gibt es?

Man kann GPTs für unfassbar viele Dinge verwenden, die mit natürlicher Sprache zu tun haben. Ein häufiger Einsatzbereich ist das Beantworten von Fragen, also der klassische Chatbot. Wenn man eine Frage stellt, versucht ein GPT, eine sinnvolle Antwort zu geben. Ein GPT kann auch Texte schreiben, wie zum Beispiel Aufsätze, Gedichte oder Geschichten. Wenn ein GPT viele mehrsprachige Texte im Training gesehen hat, kann er auch beim Übersetzen von Sprachen helfen.

Schreibe ein kurzes Gedicht mit zwei Strophen über eine bunte Ente auf einem Teich an einem schönen Sommertag im Herbst mit bunten Blättern an den Bäumen.
ChatGPT:
ChatGPT

Am Teich, da schwimmt die bunte Ente,
im Herbst, wo sich der Sommer wende.
Die Sonne glitzert auf dem See,
die Ente schnattert froh und heiter eh sie geht.

Die Bäume tragen bunte Blätter,
der Wind ist kühl, doch mild das Wetter.
Im sanften Licht, so golden fein,
fühlt sich der Herbst wie Sommer an—so soll es sein.

Aber ein GPT hat auch seine Grenzen. Die Antworten werden durch eine Anfrage des Anwenders ausgelöst, aber manchmal hat ein GPT zu dem betreffenden Thema vorher nicht genug Texte gesehen. Dann kann er aus seinen Daten keine korrekte, statistisch wahrscheinliche Antwort ableiten. Stattdessen trifft er die nächstmögliche Text-Vorhersage – und die kann mangels Wissen falsch sein.

Bei welcher Temperatur hat Wasser sein größtes Volumen?
ChatGPT:
ChatGPT

Wasser hat sein größtes Volumen, also seine größte Dichte, bei einer Temperatur von etwa 4 Grad Celsius. Unterhalb dieser Temperatur dehnt sich Wasser wieder aus, was darauf zurückzuführen ist, dass sich Eis zu bilden beginnt und die Eismoleküle eine offene, weniger dichte Struktur als flüssiges Wasser annehmen.

Ebenso besitzt jedes KI-Modell einen Redaktionsschluss für die Trainingsdaten. Das Wissen des GPT endet an diesem Datum. Alles, was danach in der Welt passiert, kann ein GPT nicht gelernt haben. Es kann also passieren, dass ein GPT etwas falsch versteht oder veraltete Informationen verwendet. Generell hat ein GPT kein echtes „Wissen“ über die Welt. Er ahmt nur nach, was er gelernt hat. Als Mensch, also Anwender, muss man das beachten und alle generierten Antworten sorgfältig prüfen.

Ein weiterer Punkt ist, dass ein GPT keine Meinung, Ethik oder Moral hat. Die Trainingsdaten stammen von der Menschheit und Menschen haben Vorurteile, kulturelle Prägungen, leben Stereotype, sind möglicherweise diskriminierend, rassistisch o. Ä. Auch solche Dinge können über das Training in einen GPT geraten. Er könnte also Inhalte erzeugen, die Vorurteile enthalten oder nicht für alle Menschen angemessen sind. Deshalb muss man vorsichtig sein und die generierten Texte immer prüfen, bevor man sie verwendet.