Baby mit Body-Cam ausgestattet: KI kann Sprache lernen wie ein Kind

Wissenschafter haben über Monate die Welt aus der Sicht eines Kleinkindes aufgezeichnet. Damit haben sie ein künstliches neuronales Netz gefüttert, das prompt daraus Wörter und ihre Bedeutung erlernt.

Woher wissen Babys, was ein Ball, ein Tisch, ein Teller ist? Und warum ist ein platter Kuhfladen kein Teller? Solche fast philosophischen Fragen treiben Eltern und Psychologen gleichermassen um. Etwa zwei neue Wörter lernt ein Baby pro Woche, bis es im Alter von 3 Jahren kein Halten mehr kennt. Mit 6 Jahren plaudert das Kind mit einem Wortschatz von mehr als 10 000 Wörtern drauflos.

Eltern machen meist intuitiv das Richtige und sprechen mit dem Baby in der sogenannten Ammensprache: melodisches Sprechen in höherer Tonlage und mit mehr Pausen. Kinder, denen dies fehlt, lernen langsamer. Wissenschafter aber zerbrechen sich den Kopf darüber, wie das Kind genau lernt. Lernt es mit der Zeit einfache Assoziationen, also dass ein Wort zu einem bestimmten Bild gehört? Oder muss es auf ein angeborenes Wissen über Sprache zurückgreifen?

Um Antworten auf diese Frage zu finden, haben amerikanische Wissenschafter nun das reale Erleben eines Kleinkindes analysiert. Ihre Erkenntnis haben sie gestern im Fachjournal «Science» veröffentlicht. Und sie lautet: Sprache kann auch ohne Vorwissen erworben werden.

60 Stunden Filmmaterial und 250 000 Wörter waren notwendig

Die Forscher haben ein kleines Mädchen über Monate begleitet. Im Alter von 6 Monaten hat es zum ersten Mal eine kleine, leichte Kamera am Kopf getragen. Sie zeichnete auf, was das Kind sah und hörte. Bis zu seinem zweiten Geburtstag trug es die Kamera etwa alle zwei Wochen für eine kurze Zeit. 60 Stunden Filmmaterial mit über einer Viertelmillion Wörtern kam so zusammen.

Mit dem, was das Kind gesehen und gehört hatte, wurde anschliessend eine künstliche Intelligenz gefüttert. Diese hatte kein Vorwissen über Sprache und lernte einfache Assoziationen. Der Neurowissenschafter Brenden Lake, der an der New York University forscht, wollte wissen, wie weit die KI mit der realistischen Erfahrung des Kleinkinds kam.

«Offenbar kommt unser Gehirn mit simplem Assoziationslernen viel weiter, als wir dachten», sagt Lake. Der CLIP-Algorithmus, der dem menschlichen Gehirn nachgebildet war, hat nicht nur gelernt, was die Wörter bedeuten. Er konnte damit auch Objekte benennen, die er zuvor nicht gesehen hatte. Generalisierung nennen es die Wissenschafter, wenn ein Algorithmus beispielsweise ein Bild von einem Stuhl richtig erkennt, auch wenn er diesen speziellen Stuhl noch nie gesehen hat.

Babys assoziieren Wörter mit Bildern

Das Experiment bildet eine realistische Lernsituation nach. Deswegen ist in diesem Fall eine Studie an nur einem Kind sinnvoll. Denn es ist ja auch nur das Gehirn eines einzelnen Kindes, das die Sprache in der Realität erlernt.

Die Studie zeigt, dass die 60 Stunden Filmdaten ausreichen, um Wissen über die allgemeine Umwelt und Sprache zu erwerben. Tatsächlich hatte das Kind noch um ein Vielfaches mehr Information zur Verfügung. Nur gut 1 Prozent seiner Lebenserfahrung konnten die Wissenschafter filmisch festhalten. Das erklärt wohl, warum Kinder ihre Muttersprache mit fast unglaublicher Geschwindigkeit erwerben.

Noch gibt es offene Fragen: Der Algorithmus konnte während des Lernens immer wieder auf alte Wort-Bild-Assoziationen zurückgreifen. Hingegen lernt das Kind seriell. Das bedeutet: Gelerntes vermag es zwar wieder aus der Erinnerung zu kramen, aber es hat die reale Wahrnehmung früherer Erlebnisse nicht dauernd griffbereit.

Aus diesem Grund sagt Chengxu Zuang, der am Massachusetts Institute of Technology zum Spracherwerb forscht: «Die Studie zeigt, dass der bestehende CLIP-Algorithmus Wortbedeutungen erlernen kann und dass dies mit einer eingeschränkten Datenmenge gelingt. Noch sind wir aber weit davon entfernt, dass eine künstliche Intelligenz menschlichen Spracherwerb nachbilden kann.»

Vorwissen über Sprache ist nicht ausgeschlossen

Natürlich ist nicht ausgeschlossen, dass das Kind eine Art von angeborenem Vorwissen über Sprache hat. Aber die neue Forschung zeigt, dass das kindliche Gehirn mit dem Erlernen einfacher Assoziationen sehr weit kommt. Und dazu war nur ein Bruchteil der Informationen notwendig, die ein Baby täglich hört und sieht.

Ob das Forschungsprojekt auch eine konkrete Anwendung haben könnte, darüber schweigen sich die Autoren aus. Doch der Sponsor der Studie war das amerikanische Verteidigungsdepartement, das einst die Entwicklung des Internets vorangetrieben hatte. Immer wieder finanziert es auch neurowissenschaftliche Forschung.

Die Studie ist auch ein Schritt in der Entwicklung der künstlichen Intelligenz. Denn bisher wurden diese sogenannten Large Language Models an grossen Datensätzen mit Billionen von Wörtern trainiert. «Wir müssten hunderttausend Jahre leben, um so viele Sprachdaten in unser Gehirn zu laden», sagt Brenden Lake, der die Studie an der New York University durchführte, in einer Medienmitteilung. Doch offenbar ist die Art und Weise, wie Kinder die Welt betrachten und Erwachsene mit ihnen sprechen, sehr effektiv.

Im Trend

Bildstrecke Olympische Spiele in Paris: die Bilder der Eröffnungszeremonie Am Freitagabend wurden in Paris die Sommerspiele eröffnet – erstmals nicht in einem Stadion, sondern in der ganzen Stadt. Die Athletinnen und Athleten drehten auf Booten im strömenden Regen eine Runde auf der Seine.

Manöver der Autokratien: Russische und chinesische Bomber patrouillieren erstmals in der Nähe von Alaska

«El Mayo» Zambada ist die graue Eminenz von Mexikos mächtigster Drogenbande. Nach seiner Festnahme dürften einige Politiker zittern

60 Stunden Filmmaterial und 250 000 Wörter waren notwendig

Babys assoziieren Wörter mit Bildern

Vorwissen über Sprache ist nicht ausgeschlossen

Die Nasa präsentiert ein Marsgestein, das möglicherweise Spuren einstigen Lebens enthält – mit der Betonung auf möglicherweise

Nicht alle hochverarbeiteten Lebensmittel sind schädlich

Haben Mücken Lieblingsopfer? Ja, mich zum Beispiel. Kann ich die Biester austricksen?

Mehr Auen und Umsiedlung – was gegen Überschwemmungen hilft

Eine neue HIV-Prophylaxe wirkt mit zwei Spritzen pro Jahr statt täglicher Tabletten – und hat eine Erfolgsrate von 100 Prozent

Der Körper verwertet Kohlenhydrate am Abend anders. Wer abnehmen will, muss dennoch nicht auf Nudeln nach 18 Uhr verzichten

Manöver der Autokratien: Russische und chinesische Bomber patrouillieren erstmals in der Nähe von Alaska

«El Mayo» Zambada ist die graue Eminenz von Mexikos mächtigster Drogenbande. Nach seiner Festnahme dürften einige Politiker zittern

«Dolder Waldhaus»: Für 62 Millionen Franken soll aus dem Hotel eine Wohnsiedlung werden. Doch die verhassten Betonklötze bleiben stehen

Russische und weissrussische Olympia-Athleten verherrlichen den Krieg gegen die Ukraine. In Paris werden sie trotzdem starten

Open AI greift mit neuer KI-Suche Google an – schon bei der Ankündigung wird ein Fehler sichtbar

Die Finanzmärkte suchen ihre Richtung

Bayreuther Festspiele: Hier gibt es Wagner, nichts als Wagner – und das bleibt gut so

Der überzeugte Bernjurassier, der im Sudan mit den Kriegsparteien spricht

Im Trend

Baby mit Body-Cam ausgestattet: KI kann Sprache lernen wie ein Kind

60 Stunden Filmmaterial und 250 000 Wörter waren notwendig

Babys assoziieren Wörter mit Bildern

Vorwissen über Sprache ist nicht ausgeschlossen

Weiter Lesen