NZZ Folio 03/94 - Thema: Im Gehirn   Inhaltsverzeichnis

Chips mit Grips

Autonome Roboter und neuronale Netze helfen, das Gehirn zu verstehen.

Von Rolf Pfeifer

Intelligenz und Denken zu verstehen war schon immer ein Traum der Menschheit. Philosophen, Psychologen, Linguisten, Anthropologen, Neurowissenschafter sowie Forscher auf dem Gebiet der sogenannten Künstlichen Intelligenz haben die Schwierigkeiten dieses Unterfangens erkannt und sich zu einer interdisziplinären Wissenschaft, der «Cognitive Science», zusammengeschlossen. Ihr Ziel ist es, zu begreifen, wie das menschliche Gehirn funktioniert, indem man es – zumindest in Teilbereichen – nachzubauen versucht. Über das Vorgehen herrscht allerdings alles andere als Einigkeit. Während die einen meinen, Intelligenz sei eine Sache des logischen Schliessens, also der abstrakten Symbolverarbeitung, sind die andern der Überzeugung, intelligente Systeme – zum Beispiel intelligente Roboter – müssten in gewissen Aspekten Ähnlichkeiten mit dem menschlichen Gehirn aufweisen. Im Verlaufe der achtziger Jahre hat die zweite Ansicht stark an Boden gewonnen. Ihr zufolge sind die Symbolverarbeitungsmodelle falsch, weil das Gehirn keine Symbole, sondern Muster verarbeitet, die den Aktivierungen der Nervenzellen entsprechen. (Symbole sind etwa Buchstaben oder Worte, denen wir eine bestimmte Bedeutung zuordnen, was für Muster nicht gilt.) Symbolverarbeitung geschieht Schritt für Schritt – sequentiell –, während im Gehirn vieles gleichzeitig – parallel – und in Echtzeit abläuft.

Künstliche neuronale Netze sind vom Nervennetz des Gehirns – dem biologischen neuronalen Netz – inspiriert. Sie bestehen aus vielen parallel arbeitenden, relativ einfachen Einheiten – Modellneuronen oder Knoten genannt –, die dicht miteinander verbunden sind und Muster anstelle von Symbolen verarbeiten. Sie sind lernfähig und robust, das heisst, sie funktionieren auch noch, wenn einzelne Elemente ausfallen. Sie können sich neuen Umständen anpassen. Kurz, sie haben wichtige Eigenschaften, die wir vom Gehirn her kennen.

So betrachtet, stellen sie also geeignete Instrumente dar, um Gehirnfunktionen zu untersuchen. Bei genauerem Hinsehen zeigt sich jedoch, dass solche Modelle für sich genommen nur Teilaspekte beschreiben. Wie die Symbolverarbeitungsmodelle sind auch sie auf dem Prinzip der Informationsverarbeitung aufgebaut. Gehirne sind aber nicht lediglich informationsverarbeitende Einheiten, eine Art biologische Computer, sondern sie sind Teil eines Organismus, der sich in einer bestimmten Umwelt auf irgendeine Art und Weise verhalten muss. Wenn wir Gehirnfunktionen verstehen wollen, müssen wir uns nicht nur mit dem Gehirn selbst, sondern auch mit dem Organismus, in den dieses Gehirn eingebettet ist, sowie mit dessen Interaktion mit der Umwelt befassen. Und hier können uns die autonomen Roboter nützliche Dienste leisten. Um dies zu illustrieren, soll die «Welt» eines neuronalen Netzes derjenigen eines autonomen Roboters gegenübergestellt werden.

Betrachten wir zunächst die «Welt» eines neuronalen Netzes, zum Beispiel des berühmten Programms NETtalk von Terry Sejnowski. Es lernt, englischen Text in gesprochene Sprache umzusetzen. Das geht folgendermassen vor sich: Dem Netz wird ein Wort eingegeben, und auf Grund der bestehenden Verbindungen erzeugt das Netz eine bestimmte Aussprache dieses Wortes. Diese Aussprache ist im Modell durch eine Anzahl Lautmerkmale dargestellt. Dann wird getestet, ob diese Merkmale mit denjenigen der korrekten Aussprache übereinstimmen. Ist das nicht der Fall, so werden die Verbindungen des Netzes entsprechend angepasst, so dass das nächstemal, wenn dasselbe Wort wieder auftaucht, die Aussprache etwas besser ist. Dieser Vorgang wird so oft wiederholt – typischerweise einige tausendmal –, bis die Aussprache akzeptabel ist. Das Netz lernt so, nicht nur einzelne Beispiele, sondern auch neue Worte richtig auszusprechen, weil es verallgemeinern kann.

NETtalk arbeitet parallel: rund 300 Knoten und knapp 20 000 Verknüpfungen bilden das neuronale Netz. Als lernendes System, das Aktivierungsmuster verarbeitet, weist NETtalk gewisse Ähnlichkeiten mit einem Gehirn auf. Sie sind allerdings sehr oberflächlicher Art: Weder sind Knoten und Verknüpfungen angemessene Modelle einzelner Neuronen, noch kommt das Lernverfahren in der Natur in dieser Form vor. Der wichtigste Unterschied besteht aber darin, dass NETtalk, obzwar es parallel arbeitet, auf Symbole nicht verzichten kann. Die Eingabe – der Input – erfolgt nämlich in Form von Buchstaben. Was diese Buchstaben und die daraus zusammengesetzten Worte bedeuten, davon hat das Netzwerk selbst keine Ahnung; es produziert lediglich eine Ausgabe – den Output – in Form einer Anzahl von Lautmerkmalen. Das spielt auch keine Rolle, da ja der Input vom Konstrukteur des Modells vorgegeben wird. In diesem Sinne funktioniert NETtalk in einer von einem Menschen in Form von Symbolen vorgegebenen virtuellen Welt. Es ist ein reines Informationsverarbeitungsmodell: Aus einem bestimmten vorcodierten Input erzeugt es einen bestimmten Output. Es hat keinen direkten Kontakt zur Aussenwelt.

Im Gegensatz zu einer virtuellen Welt gibt es in der realen Welt keine Symbole: Buchstaben sind schwarzgefärbte Stellen auf dem Papier. Wir Erwachsenen wissen, dass diese schwarzgefärbten Stellen interessant sind und dass es sich lohnt, unsere Aufmerksamkeit darauf zu richten. Erst durch den Akt des Lesens werden sie zu Symbolen. NETtalk braucht sich um solche Dinge nicht zu kümmern.

Wenden wir uns der realen Welt zu und betrachten wir einen Akteur, der sich in einer Umgebung, beispielsweise auf einer Strasse, bewegt. (Wir reden von Akteur, wenn nicht unterschieden werden soll, ob es sich um einen Menschen, ein Tier, oder einen Roboter handelt.) Auf der Strasse gibt es weder Symbole noch fein säuberlich vorbereitete Muster, die verarbeitet werden können, sondern vielmehr einen kontinuierlichen Strom von Stimulierung, der auf Augen und Ohren trifft. Diese Stimulierung ist stark abhängig davon, was der Akteur gerade tut, in welche Richtung er schaut. Es wird ihm nicht ein Input präsentiert, worauf er einen Output erzeugen soll. Er muss selbst bestimmen, was er beachten, was er lernen soll. Kommt dazu, dass er laufend und schnell handeln muss: das Input-Output-Modell der Informationsverarbeitung ist dafür ungenügend.

Wollen wir einen Roboter entwickeln, der sich fortbewegen kann, sind wir gezwungen, uns mit genau diesen Problemen zu befassen. Von besonderem Interesse sind die autonomen Roboter. Das sind Maschinen, die ohne menschliches Dazutun in einer sich laufend verändernden Umgebung eine oder mehrere Aufgaben erfüllen und sich über längere Zeit funktionstüchtig erhalten können. Ein autonomer Roboter ist etwa ein Rasenmäher mit einer Solarzelle auf dem Rücken, der immer, wenn die Sonne scheint, zu mähen beginnt. Er braucht nicht versorgt zu werden, man braucht ihm keine Instruktionen zu geben – er ist einfach da und mäht. Ein Prototyp eines solchen Rasenmähers, der etwa zweitausend Ecu kostet, wurde an einem Kongress in Brüssel letztes Jahr gezeigt.

Um Aufgaben wie Rasenmähen, Einsammeln von Abfall, Reinigen eines Abwasserkanals oder die nächtliche Überwachung eines Fabrikareals ausführen zu können, muss der Roboter über gewisse elementare Fähigkeiten verfügen. Eine ist beispielsweise das Identifizieren von Abfall, eine andere das Vermeiden von Hindernissen, wenn sich der Roboter bewegt. Autonome Roboter sind aus technischer Sicht von der Anwendung her äusserst interessant. Dass sie aber auch nutzbringend für die Erforschung von Gehirnfunktionen eingesetzt werden können, soll anhand der folgenden Beispiele gezeigt werden.

Wir haben in unserer interdisziplinär zusammengesetzten Forschungsgruppe an der Universität Zürich ein neuronales Netz für einen Roboter entwickelt, der sich diese beiden Fähigkeiten – Vermeiden von Hindernissen, Identifizieren von Abfall – in einer bestimmten Umgebung im Laufe der Zeit erwerben kann. Die Hardware des Roboters, Khepera /e(i) ?1TM genannt, stammt von der Gruppe von Jean-Daniel Nicoud vom Laboratoire de Microinformatique der ETH Lausanne, mit der wir seit längerem zusammenarbeiten. Damit der Roboter auf Umwelteinflüsse reagieren kann, ist er mit einer Anzahl Sensoren ausgerüstet: Kollisionsdetektoren werden aktiviert, wenn der Roboter irgendwo anstösst, Distanzsensoren messen den Abstand des Roboters von einem Gegenstand. Ferner verfügt der Roboter über Sensoren, mit denen er starke Lichtquellen wahrnehmen kann. (Die verschiedenen Typen von Sensoren funktionieren mit Infrarot.) Bewegt sich der Roboter in einer Umwelt, so werden diese Sensoren kontinuierlich stimuliert. Über ein assoziatives neuronales Netz sind sie miteinander verbunden. Die Frage, was relevant ist, worauf also der Roboter reagieren soll, ist damit allerdings noch nicht gelöst. Es gibt auch zurzeit keine allgemein anerkannte Lösung dieses Problems.

Die Lösung, die wir gewählt haben, geht davon aus, dass alle Lebewesen, Menschen wie Tiere, mit gewissen Grundreflexen ausgerüstet sind. Wenn ein Reflex ausgelöst wird, so ist dies für den Organismus bedeutsam, denn er bewahrt ihn vor Schäden. Fasst man etwa eine heisse Kartoffel an, so lässt man sie sofort fallen, was die Hand vor Verbrennungen schützt. Heisse Kartoffeln dampfen, und den Dampf kann man sehen. Diese Tatsache kann man ausnützen, indem man Dampf mit heiss assoziiert, so dass man inskünftig heisse Kartoffeln nicht mehr anfasst. Man verknüpft also Informationen von zwei verschiedenartigen Sensoren miteinander, Temperatur auf der Haut und Information vom Auge. Genau diesen Mechanismus kann man sich bei Robotern zunutze machen.

Man rüstet den Roboter mit einer Anzahl von Grundreflexen aus; sie bestimmen, was für den Roboter von Bedeutung ist. In unserem Beispiel: «Wenn eine Kollision auf der linken Seite stattfindet, nach rechts drehen» (und umgekehrt). Oder: «Wenn eine Lichtquelle auftaucht, zum Zentrum der Lichtquelle hindrehen.» Im Normalfall soll der Roboter geradeaus fahren. Lichtquellen kann man sich als Futterplätze denken oder als Orte, wo Abfall zu finden ist, je nachdem, was für eine Aufgabe der Roboter erfüllen soll.

Lässt man den Roboter in einer bestimmten Umgebung, beispielsweise in einem Büroraum, herumfahren, so wird er anfänglich häufig anstossen, was jeweils den vordefinierten Reflex auslöst. Da der Roboter bei einer Kollision ja immer auch sehr nahe am Hindernis ist, können die entsprechenden Muster aus Kollisions- und Distanzsensoren über das neuronale Netz assoziiert werden. Dadurch wird es möglich, dass die Handlung des Wegdrehens mit der Zeit auch von den Distanzsensoren alleine ausgelöst wird, ohne dass der Roboter anstösst. Auf diese Weise wird das Relevanzproblem gelöst: Gelernt wird immer, wenn eine Reflexhandlung ausgelöst wird. Diese Art des Lernens ist sinnvoll, da nicht im voraus definiert werden soll, wie die Hindernisse, denen der Roboter begegnet, genau aussehen.

Das Erkennen von Ähnlichkeiten ist eine wichtige Eigenschaft von neuronalen Netzen. Fährt der Roboter auf ein Hindernis zu, so sind sich zwei Muster in den Distanzsensoren, die kurz aufeinanderfolgen, normalerweise sehr ähnlich, so dass die Handlung schon ausgelöst wird, wenn der Roboter etwas weiter vom Hindernis entfernt ist. Der Roboter lernt immer weiter, so dass er mit der Zeit schon frühzeitig abzudrehen beginnt.

Es ist wichtig, dass die Ähnlichkeit aufeinanderfolgender Muster auf Grund der Interaktion des Roboters mit der Umwelt zustande kommt. Sie sitzt weder im Roboter selbst noch in der Umwelt, sondern sie ergibt sich aus der Tatsache, dass sich der Roboter auf ein Hindernis zubewegt. Bei einem Modell wie NETtalk kommt ein solcher Lerneffekt nur zustande, wenn dem Netz genau die richtigen Muster serviert werden. Ein Roboter bekommt nichts serviert, und sein Lernen wird nicht von irgendeinem Lehrer überwacht – es ist selbstorganisiert.

Mit genau demselben Mechanismus kann der Roboter nicht nur Kollisionen, sondern auch Lichtquellen mit Mustern der Distanzsensoren assoziieren – also diejenigen Objekte, die für ihn von Interesse sind. Befinden sich Lichtquellen beispielsweise immer entlang von Wänden, so lernt der Roboter mit der Zeit, Wänden entlangzugehen, auch wenn keine Lichtquellen vorhanden sind, da Wände spezifischen Mustern in den Distanzsensoren entsprechen. Nehmen wir an, dass der Roboter Abfall einsammeln soll. Anstatt Sensoren für Lichtquellen hat er Sensoren für Abfall. Der Abfall wird in der Regel entlang von Wänden deponiert. In einer solchen Umwelt wird er lernen, den Wänden entlangzugehen, um den Abfall zu finden. Wird der Abfall nicht an Wänden deponiert, wird der Roboter auch nicht lernen, Wänden entlangzugehen.

Das Beispiel illustriert, dass man Lernvorgänge schon in sehr einfachen neuronalen Netzen nur dann verstehen kann, wenn man die System-Umwelt-Interaktion mitberücksichtigt. Die Tatsache etwa, dass zwei aufeinanderfolgende Sensormuster ähnlich sind, wenn sich der Roboter auf ein Hindernis zu bewegt, wird vom neuronalen Netz ausgenützt. Die Idee, dass zum Verständnis von neuronalen Netzen die System-Umwelt- Interaktion mitberücksichtigt werden muss, soll anhand von zwei weiteren Beispielen illustriert werden.

Die Entwicklung von Robotern, die nicht auf Rädern fahren, sondern gehen, hat in den letzten Jahren grosse Aufmerksamkeit erregt. So ist etwa das Problem aufgetaucht, wie bei einem sechsbeinigen Roboter, der einem grossen Insekt ähnelt, die einzelnen Gliedmassen beim Gehen koordiniert werden. Man hat festgestellt, dass bei Insekten die Steuerungselemente, das heisst die neuronalen Netze für die Beine beim Gehen, ohne zentrale Kontrollinstanz auskommen. Wie ist es dann aber möglich, sechs Beine zu koordinieren, ohne sie von einem Punkt aus zu dirigieren?

Das kann man sich wie folgt vorstellen. Erhöht das Insekt die Kraft auf einem Bein, so wird dadurch automatisch die Kraft auf sämtlichen anderen Beinen verändert, weil das Insekt auf einer Unterlage steht. Diese Tatsache wird offenbar vom Gehirn der Insekten genutzt. Indem man das der Natur abgeschaut hat, konnte das Laufverhalten sechsbeiniger Roboter wesentlich verbessert werden. Rodney Brooks vom Massachusetts Institute of Technology hat eine entsprechende Kontrollarchitektur, die vom deutschen Biologen Holk Cruse in Bielefeld erarbeitet wurde, erfolgreich für seinen sechsbeinigen Roboter Attilla verwendet. Interessant an diesem Beispiel ist die Tatsache, dass sämtliche Beine in einem gewissen Sinne via Umwelt miteinander in Verbindung stehen. Diese Verbindung wird über physikalische Prozesse, durch Kräfte, vermittelt und nicht durch einen internen Informationsprozess.

Das zweite Beispiel stützt sich auf Untersuchungen über das Verhalten von Hausfliegen von Nicholas Franceschini vom Centre national de la recherche scientifique in Marseille. Nehmen wir an, wir wollen einen Roboter bauen, der sich mit unterschiedlichen Geschwindigkeiten fortbewegen kann. Bewegt er sich schnell, so soll er einem Hindernis früher ausweichen, als wenn er sich langsam bewegt. Dies entspricht unserer Intuition. Wir brauchen also einen adaptiven Mechanismus, der auf Grund von Geschwindigkeit und Distanz bestimmt, wann abgedreht werden soll – würde man meinen. Bei näherem Hinsehen stellt sich jedoch heraus, dass dies nicht notwendig ist.

Neuere Untersuchungen zeigen, dass das Orientierungsverhalten von Hausfliegen auf dem Messen von Bewegung beruht. Dies hat entscheidende Vorteile. Wir alle haben die Erfahrung gemacht, dass bei einer Zugfahrt etwa Bäume, die nahe dem Bahngeleise sind, sich mit grosser Geschwindigkeit vorbeibewegen, während solche, die weiter weg sind, nur langsam übers Gesichtsfeld ziehen. Anders gesagt: Fährt der Zug langsam, so bewegt sich ein Baum, der nahe an der Bahnlinie steht, etwa gleich schnell über das Gesichtsfeld wie ein weiter entfernter Baum, wenn der Zug entsprechend schneller fährt. Die sogenannte Winkelgeschwindigkeit ist in beiden Fällen ungefähr gleich – ein entsprechender Bewegungssensor misst in beiden Fällen ähnliche Werte.

Übertragen wir diese Erkenntnis auf einen Roboter, so braucht er lediglich bei einer bestimmten Winkelgeschwindigkeit abzudrehen – Distanz und Geschwindigkeit sind dann automatisch richtig. Grosse Distanz und grosse Geschwindigkeit ergeben die gleiche Winkelgeschwindigkeit wie kleine Distanz und kleine Geschwindigkeit. Dieser Effekt, Bewegungsparallaxe genannt, wird vom Gehirn der Insekten ausgenutzt. Es braucht keinen adaptiven Mechanismus, der aus der Geschwindigkeit die Distanz berechnet, bei der abgedreht werden muss. Adaptivität muss also nicht in Form eines neuronalen Mechanismus im Akteur selbst vorhanden sein, da sie in der Interaktion eines Akteurs mit seiner Umwelt steckt.
Was können wir aus diesen Beispielen lernen?

Erstens: Indem wir Roboter bauen und ihr Verhalten untersuchen, lernen wir das Zusammenspiel von Kontrollstruktur – dem neuronalen Netz des Roboters –, Sensoren, Umwelt und Verhalten besser zu verstehen. Im Gegensatz zur Untersuchung von natürlichen Akteuren wie Tieren und Menschen haben wir es bei unserem Roboter mit einer «white box» und nicht mit einer «black box» zu tun, das heisst, wir wissen genau, was in ihm drinsteckt. Wir haben ihn ja entworfen und gebaut.

Zweitens: Um zu verstehen, wie die Fähigkeit, Hindernisse zu umgehen, die Koordination der Beine von Insekten beim Gehen oder das Orientierungsverhalten von Fliegen zustande kommt, müssen wir die System- Umwelt-Interaktion untersuchen. Das schliesst physikalische Prozesse mit ein.

Drittens: Ein Akteur kann von der Tatsache profitieren, dass die reale Welt existiert. Wie wir gesehen haben, werden die neuen Sensordaten, bewegt sich ein Akteur auf ein Hindernis zu, den vorhergehenden mit grosser Wahrscheinlichkeit ähnlich sein. Verlust von Daten ist also nicht so schlimm – was erstaunt, da ja in der Informatik die Vermeidung von Datenverlust zentral ist.

Heutzutage ist alles Informationsverarbeitung. Deshalb ist es auch nicht verwunderlich, dass häufig diese Fähigkeit des Gehirns in den Vordergrund gerückt wird. Auch künstliche neuronale Netze sind Informationsverarbeitungsmodelle. Wir müssen uns aber fragen, wozu denn diese Informationsverarbeitung letztlich gut ist, ist es doch ihr Ziel, etwas in der realen Welt zu bewirken. Stellt man sich diese Frage, wird man gezwungen, Verhalten – also System-Umwelt-Interaktion – zu betrachten, und das ist nicht lediglich eine Angelegenheit der Informationsverarbeitung. Will man Gehirnfunktionen verstehen, muss man letztlich immer in irgendeiner Form eine Beziehung zum Verhalten herstellen.

Computermodelle sind zwar wichtige Instrumente zur Untersuchung von Gehirnfunktionen, doch sie betonen vor allem die Informationsverarbeitung. Roboter anderseits sind physikalische Objekte, die sich in einer realen Umwelt verhalten. Ohne dass dies in einem Modell oder im «Gehirn» des Roboters dargestellt werden muss, wirken an ihm physikalische Kräfte wie etwa die Schwerkraft genau wie bei biologischen Systemen. Dies kann vom Gehirn ausgenützt werden, wie beispielsweise die Koordination der Beine beim Gehen gezeigt hat. Dadurch wird vieles einfacher, und die Roboter werden billiger.

Obwohl heutige autonome Roboter in keiner Weise auch nur annähernd die Komplexität eines Menschen aufweisen, haben sie sich zur Ergründung von Gehirnfunktionen als äusserst fruchtbar erwiesen. Wenn wir ein Organ von der Komplexität des menschlichen Gehirns je verstehen wollen, müssen wir zuerst die System- Umwelt-Interaktion ganz einfacher Systeme verstehen lernen. Schon diese können, wie wir gesehen haben, recht komplex sein. Autonome Roboter können demzufolge auch der Erforschung von biologischen Systemen dienen, wie umgekehrt die Robotik von der Biologie profitieren kann.

Rolf Pfeifer ist Professor für Informatik an der
Universität Zürich.


Teilen

Für 94 Franken pro Jahr gibt es NZZ Folio auch im Abonnement. Näheres hier.

Urheberrecht gilt auch im Internet: Verlinken erlaubt, Kopieren verboten.