Wer in Sachen KI den Anschluss verpasst hat, kann sein Wissen hier auffrischen.
Zu künstlicher Intelligenz (KI) gibt es fast täglich Neuigkeiten. Wenn man den Anfang der KI-Welle verpasst hat, klingt manches komplizierter, als es in Wirklichkeit ist. Wir haben grundsätzliche Fragen zusammengetragen für all jene, die jetzt ihre Berührungsängste überwinden wollen.
Prompt ist Englisch für «Aufforderung». Viele KI-Programme sind wie ein Chat aufgebaut. Der Nutzer tippt Fragen oder Aufforderungen ein, die künstliche Intelligenz reagiert darauf. Und diese Aufforderungen des Nutzers nennt man Prompts.
Es kursieren allerhand Tipps dazu, wie man das bestmögliche aus KI herausholt. Für den Anfang kann man sich merken: Ein guter Prompt besteht aus Rolle, Kontext und Aufforderung.
Zum Beispiel: «Du bist Experte für Gartenbau. Mein Garten ist eher schattig, und ich wohne in Basel. Was für Gemüse kann ich im April setzen?» Oder: «Du bist eine tolle Märchenerzählerin. Meine Kinder mögen Hasen, fürchten sich aber vor Hexen. Schreibe eine fröhliche Gutenachtgeschichte, die nicht länger als 5 Minuten Vorlesezeit hat.»
Der erste und bekannteste KI-Chatbot ist Chat-GPT von Open AI. Es gibt ihn in mehreren Versionen. Hier kann man ihn gratis ausprobieren – allerdings ist im Moment dafür eine Anmeldung nötig. Für etwa 20 Franken im Monat bekommt man die neueste Version (GPT4), die etwas akkuratere Ergebnisse gibt und Bilder erstellen kann.
Ähnlich wie Chat-GPT funktioniert der Chatbot Gemini von Google. Für diesen muss man sich mit einem Google-Konto anmelden, und wie bei Chat-GPT gibt es eine kostenlose und eine Pro-Version.
Ganz ohne Anmeldung kann man bei Microsoft Bing, inzwischen auch Copilot genannt, mit einem KI-Assistenten chatten. Wenn man eine Frage stellt, durchsucht dieser Chatbot auch das Internet und fasst die Ergebnisse zusammen. Deshalb ist er für aktuelle Fragen besser geeignet als Chat-GPT und Gemini, die in der kostenlosen Version keinen Zugriff auf die aktuellsten Informationen aus dem Internet haben. Der Chatbot von Bing gibt am Ende seiner Antwort Quellen an, allerdings nicht immer akkurat.
Auch das Programm Perplexity kann man ohne Anmeldung befragen. Perplexity nutzt eine traditionelle Websuche, um relevante Inhalte zu finden, und fasst diese mithilfe von KI zusammen. Es gibt mit Fussnoten Quellen an, deswegen ist leichter nachprüfbar, ob die Informationen auch wirklich stimmen. Denn darauf kann man sich bei KI generell nicht blind verlassen.
Chat-GPT war das erste Programm, das erlaubt hat, sich mit Sprach-KI wie in einem Gespräch zu unterhalten. Die Firma Open AI hat es im November 2022 veröffentlicht und damit dem Thema künstliche Intelligenz enorme Aufmerksamkeit verschafft.
Hier können Sie mehr über die verschiedenen Arten von KI erfahren.
Programme wie Chat-GPT wirken allwissend, sie beantworten alle möglichen Fragen in selbstbewusstem Ton. Sie haben aber kein Wissen wie Menschen, sondern eher wie eine Enzyklopädie.
Chat-GPT und andere KI-Chatbots funktionieren wie die Wortvorhersage im Google-Suchfeld – jene, die bei der Eingabe «Schweizer sind» als Fortsetzung «Bünzlis» und «reich» vorschlägt.
Doch während die Google-Vorhersage auf den Eingaben anderer Nutzer basiert, ist die Wortvorhersage von KI-Bots wie Chat-GPT viel ausgeklügelter. Sie baut auf Unmengen Text aus dem Internet: Konversationen aus Online-Foren, Blogs, digitalisierte Bücher, Wikipedia.
Mit diesem Text lernen KI-Programme, wie Wörter zusammenhängen und wie Sätze normalerweise weitergehen. So können sie Sätze nicht nur grammatikalisch korrekt fortsetzen, sondern oft auch faktisch richtig. Vorausgesetzt, die nötigen Informationen kamen oft genug in den Texten vor, die sie bei ihrer Erstellung eingelesen hat.
Wenn das nicht der Fall ist, erfindet sie Informationen oft einfach. Dieses Phänomen nennt man auch Halluzination.
Es gibt viele Werkzeuge, um KI-Bilder zu erstellen, die meisten davon sind mittlerweile kostenpflichtig. Gratis verfügbar ist jene von Microsoft, allerdings braucht es dafür ein Microsoft-Konto. Auch Stable Diffusion kann man auf dieser Seite nach der Anmeldung gratis ausprobieren.
Danach reicht es jeweils, eine Zeile Bildbeschreibung einzugeben, und das erwünschte Bild erscheint nach etwas Wartezeit.
Konkrete, detaillierte Anweisungen helfen, das Bild zu bekommen, das man sich wünscht. Ausserdem sollte man den erwünschten Stil definieren: fotorealistisch, impressionistisch, Paparazzifoto, Instagram-Foto. Englische Anweisungen funktionieren oft besser als deutsche.
Mehr Tipps dazu gibt es in diesem Artikel, der erklärt, wie man eine Weihnachtskarte mit KI gestaltet.
KI, die Text erstellt, basiert darauf, vorherzusagen, wie Texte plausibel weitergehen. Das lernt sie aus Übungsdaten aus dem ganzen Internet.
Analog funktioniert Bild-KI, nur dass sie nicht Wörter vorhersagt, sondern die Pixel, aus denen ein Bild besteht, und zwar anhand der Bildbeschreibung. Eine detailliertere Erklärung finden Sie hier.
Die Daten, aus denen diese Art von KI lernt, sind Bild-Text-Paare. Zum Beispiel Bilder aus Medien mit Bildunterschrift, Produkte aus Online-Shops und ihre Beschreibungen, Werbebilder. Diese Daten werden meist ungeprüft in die KI eingespeist. So konnte es passieren, dass illegale Bilder einflossen, von sexuellem Missbrauch von Kindern.
Wenn man KI um ein Bild bittet, dann sucht sie nicht einfach passende Fotos im Internet, sondern generiert jedes Mal ein neues, einzigartiges Bild. Allerdings gleichen diese Bilder manchmal stark den Werken von einzelnen Künstlern. Meist haben diese keine Einwilligung dafür gegeben, dass ihre Werke in KI einfliessen. Rechtlich sind KI-Bilder also eine Grauzone.
Fragt man Chat-GPT, was es über Frauen denke, beteuert es, es sei programmiert, «um neutral und ohne Vorurteile oder Meinungen zu allen Themen, einschliesslich Geschlechterfragen, zu sein».
Das ist eine vorprogrammierte Antwort. Die Entwickler von kommerziellen KI-Systemen geben sich grosse Mühe, dass ihre Systeme keine kontroversen Aussagen machen. Schliesslich wollen sie die Technologie an Firmenkunden verkaufen. Und denen ist ein professioneller, unpolitischer Ton wichtig.
Den zu gewährleisten, ist eine ziemliche Herausforderung. Denn wie oben beschrieben, lernt KI aus riesigen Textmengen aus dem Internet.
Ins Frauenbild von KI fliessen Beschreibungen aus digitalisierten Romanen ebenso ein wie pornografische Inhalte, obskure Foren ebenso wie Zeitungsartikel. Wenn man sie unzensiert liesse, würde KI sehr viele fragwürdige Inhalte erzeugen: rassistisch, sexistisch, antisemitisch – eben alle Vorurteile wiedergeben, die in der Welt und im Internet zirkulieren.
Bei bildgebender KI sind diese Stereotype noch besser erkennbar als beim Text. Die ersten Versionen dieser Programme erzeugten von Frauen fast immer übertrieben sexy Bilder. Bilder von CEO zeigten allesamt weisse Männer.
Daraufhin versuchten Hersteller, politisch korrektere Bilder zu erzeugen, mit absurden Auswirkungen: Gefragt nach dem Bild eines Papstes, erzeugte Googles KI Gemini etwa Bilder eines schwarzen und eines weiblichen Papstes.
Es gibt keinen Detektor, der gesichert erkennen kann, ob ein Bild oder ein Text von einer KI stammt.
Künstlich generierte Texte haben durchaus gewisse Eigenheiten: Weil sie durch Statistik gemacht sind, sind sie weniger zufällig und etwas vorhersehbarer als das, was Menschen schreiben. Diese Merkmale nutzen KI-Detektoren. Aber verlässlich sind diese Detektoren nicht, man sollte ihre Einschätzung auf keinen Fall als Wahrheit betrachten.
Bei KI-Bildern wäre es leichter möglich, gewisse Muster einzubauen, die der Mensch nicht erkennt, aber Maschinen schon. Durch einen Screenshot oder Bearbeitung werden auch solche Wasserzeichen obsolet, trotzdem könnten sie einen Beitrag zur Erkennung von Fakes leisten. Dafür brauchte es aber die Kooperation der Tech-Firmen.
Chat-GPT ist ein Programm, das auf einer ganz bestimmten Art von künstlicher Intelligenz basiert, nämlich generativer künstlicher Intelligenz. Damit bezeichnet man eine Gruppe von Programmen, die KI-Algorithmen nutzen, um Bilder, Text oder Videos zu erstellen. Seit Chat-GPT lanciert wurde, dreht sich der KI-Hype vor allem um diese Form von KI.
Wie die folgende Grafik zeigt, ist der KI-Begriff aber sehr viel weiter gefasst.
Bei KI gehören auch Systeme zur Gesichtserkennung dazu, die Algorithmen der Google-Suche, neue Methoden, um Materialien zu finden, oder auch jene Systeme, die Menschen im Spielen wie Schach oder Go übertreffen.
Die Grenze zwischen KI und restlichen Computerprogrammen ist nicht ganz scharf, denn für KI gibt es nicht nur eine Definition. Heutzutage meint man oft maschinelles Lernen: Programme, die ihre Fähigkeiten aus grossen Datenmengen lernen. Manchmal gibt man ihnen dabei Regeln vor, manchmal lässt man sie selbständig Schlüsse ziehen.
Bei traditionellen Computerprogrammen hingegen programmieren Menschen Wenn-dann-Regeln ein: Wenn jemand hier klickt, dann erscheint dieses Bild, wenn die Maschine zu heiss wird, schaltet sie ab.
Der Begriff künstliche Intelligenz sollte aber nicht glauben machen, dass diese Systeme so funktionieren wie das menschliche Gehirn oder gar bewusst sind. Mit den machthungrigen Robotern, die man aus Science-Fiction-Filmen kennt, hat existierende KI nichts zu tun.
Ein Artikel aus der «»