Ein Large Language Model (LLM) ist eine spezielle Art von Computerprogramm, das auf die Verarbeitung von Sprache spezialisiert ist. Die englische Abkürzung LLM steht im Deutschen für „großes Sprachmodell“. Dabei bedeutet „Modell“, dass es eine Art Programm ist, das nach bestimmten Regeln arbeitet, und „groß“, weil es mit enormen Datenmengen trainiert wurde. Diese Daten bestehen aus Texten, die aus Büchern, Artikeln, Websites und anderen Quellen stammen. Ein LLM „liest“ also Millionen von Texten und lernt dadurch, Muster in der Sprache zu erkennen.
Vereinfacht gesagt, „versteht“ ein LLM nach dem Training die Muster einer Sprache so gut, dass es selbst Texte erzeugen kann, die menschenähnlich klingen. Die Texte sind aber nicht von einem Menschen, der mitdenkt und seine Formulierungen überlegt. Es ist nur eine statistische Vorhersage. Es gibt keine vorgefertigten Antworten, sondern neue Sätze und Texte werden auf der Grundlage dessen generiert, was das KI-Modell gelernt hat und was der Benutzer eingegeben hat. Auf der Basis der Eingabe erkennt das Modell statistische Muster und berechnet daraufhin aus den gelernten Mustern, welche Wörter oder Sätze am wahrscheinlichsten als Antwort passen.
Dadurch wirkt ein LLM sehr „intelligent“, versteht aber die Sprache nicht so wie ein Mensch, sondern arbeitet rein auf der Basis von Mustern. Es kann Texte gut nachahmen, aber es hat kein eigenes Bewusstsein oder Verständnis der Welt.
Wie funktioniert ein LLM?
Ein Large Language Model (LLM) „lernt“ auf eine Art, die man mit dem menschlichen Lernen vergleichen kann, obwohl es sich dabei um rein technologische Prozesse handelt. Die Ganze basiert auf komplizierter Mathematik und Berechnungen auf Supercomputern mit einer riesigen Anzahl an Prozessoren. So wie wir Menschen durch das Lesen von Büchern, Zuhören oder das Sprechen mit anderen unsere Sprachfähigkeiten verbessern, lernt ein LLM durch das „Lesen“ riesiger Mengen von Texten.
Was bedeutet das konkret? Wenn man zum Beispiel oft liest, dass nach den Worten „Es war einmal“ ein Märchen beginnt, merkt sich das LLM diese Regelmäßigkeit. Es „weiß“ dann, dass, wenn es diese Worte sieht, wahrscheinlich eine Geschichte folgt. Ein LLM arbeitet jedoch nicht mit festen Regeln, sondern mit Wahrscheinlichkeiten. Es analysiert, welche Wörter oder Phrasen statistisch gesehen am häufigsten in bestimmten Kontexten vorkommen. So kann es Vorhersagen treffen, welches Wort wahrscheinlich als Nächstes folgt, wenn es einen Text schreibt oder eine Antwort auf eine Frage gibt.
Wofür wird ein LLM verwendet?
Large Language Models (LLMs) haben inzwischen viele praktische Anwendungsfelder im Alltag gefunden. Ein sehr bekanntes Beispiel ist der Einsatz von Chatbots. Diese Programme nutzen LLMs, um auf Fragen von Nutzern zu antworten und Hilfestellung zu bieten, wie auf Websites von Unternehmen. Viele Banken, Versicherungen oder Online-Shops bieten solche elektronischen Assistenten ihren Kunden inzwischen an.
Auf diese Weise können rund um die Uhr Fragen etwa zu Öffnungszeiten, Kontaktdaten, Vertragsbedingungen, Produkten, Versandbedingungen und vieles mehr beantwortet werden. Wichtig dabei ist, dass das LLM hinter dem jeweiligen Chatbot genau diese unternehmensspezifischen Informationen vorher gelernt hat.
Ein weiteres wichtiges Einsatzfeld ist die Übersetzung von Texten. Dienste wie Google Translate nutzen LLMs, um Texte aus einer Sprache in eine andere zu übertragen. Dabei hilft das Modell, grammatikalische Strukturen zu erkennen und diese in die Zielsprache zu übersetzen. Je mehr Daten das Modell bekommt, desto besser wird es in der Regel bei der Übersetzung, auch wenn die Ergebnisse nicht immer perfekt sind. Insbesondere bei seltenen Sprachen machen solche Übersetzer bei der Wahl der Worte oder Formulierungen eher Fehler.
LLMs werden auch in kreativen und wissenschaftlichen Bereichen verwendet. Sie können Texte schreiben, Informationen zusammenfassen, Kernaussagen aus Texten extrahieren oder komplexe Texte in eine verständlichere Sprache übersetzen.
Grenzen von LLMs
Trotz ihrer beeindruckenden Fähigkeiten haben LLMs auch Grenzen.
- Sie sind sehr gut darin, Sprache zu imitieren, aber sie „verstehen“ den Inhalt eines Textes nicht so wie ein Mensch.
- Manchmal generieren LLMs falsche Antworten oder denken sich Antworten aus, nur weil sie statistisch so berechnet wurden. Ein LLM merkt nicht, dass es etwas falsch macht.
- Ein LLM hat kein eigenes Bewusstsein oder echtes Verständnis der Welt.
- Ein LLM hat keine Empathie, Gefühle oder dergleichen.
- LLMs sind vollkommen abhängig von Menge, Qualität und Inhalt der Trainingsdaten.
- LLMs sind nicht kreativ. Ihre „Ideen“ haben sie vorher aus Texten von Menschen gelernt und können anschließend wieder Menschen damit helfen. Aber sie produzieren keine Originalität.