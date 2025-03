Publiziert am 12.03.2025

Das erste KI-Modell heisst Gemini Robotics. Es sorgt dafür, dass das System nicht nur Texte, Bilder oder Videos produzieren, sondern auch Aktionen eines Roboters steuern kann.

Das zweite Modell trägt den Zusatz «ER» («embodied reasoning», deutsch: «verkörperte Logik»). Es erweitert unter anderem das räumliche Denken von Google Gemini.

Geschickter Roboter

Gemini Robotics-ER könne im Handumdrehen völlig neue Fähigkeiten entwickeln, heisst es in einem Blogeintrag von Google. «Wird dem KI-Modell etwa eine Kaffeetasse gezeigt, kann es intuitiv einen geeigneten Zwei-Finger-Griff wählen, um die Tasse am Henkel aufzuheben, und einen Bewegungsablauf berechnen, um sich ihr sicher zu nähern.»

Die KI-Spezialisten des Internet-Konzerns bei Google DeepMind arbeiten dabei mit dem texanischen Roboter-Start-up Apptronik zusammen, um KI-gesteuerte humanoide Roboter zu bauen, die in dynamischen Umgebungen effizient und sicher agieren können. Apptronik hat bereits mehrere Robotermodelle entwickelt, darunter den humanoiden Roboter «Apollo», der für Aufgaben wie das Heben, Bewegen und Stapeln von Kisten in Logistik und Fertigung konzipiert ist.

Drei elementare Eigenschaften

In dem Blogeintrag von Google heisst es, um für den Menschen nützlich und hilfreich zu sein, benötigten KI-Modelle für die Robotik drei wesentliche Eigenschaften: Sie müssen erstens allgemein sein, sich an verschiedene Situationen anpassen können.

Zweitens müssten sie interaktiv sein, um Anweisungen oder Veränderungen in ihrer Umgebung zu verstehen und schnell darauf reagieren zu können. Und drittens müssten sie geschickt sein und Dinge erledigen können, die Menschen normalerweise mit ihren Händen und Fingern machen können, etwa Gegenstände vorsichtig manipulieren. «Gemini Robotics bedeutet einen wesentlichen Leistungsschub in allen drei Bereichen und bringt uns näher an echte Allzweckroboter.»

In dem Blog-Eintrag verdeutlicht Google in mehreren Videos die Leistungsfähigkeit des neuen KI-Systems. So kann Gemini Robotics etwa auf Zuruf Gegenstände in Gefässe sortieren, während diese durch den Raum bewegt werden. Ein anderes Beispiel zeigt den Roboter, wie er ein Origami faltet.

Google wird seine Roboter-KI auch Testern zur Verfügung stellen. Dazu gehörten die Roboter-Spezialisten Agile Robots, Agility Robots, Boston Dynamics und Enchanted Tools.

Eingebaute Sicherheit

Das Forschungsprojekt umfasse auch das Thema Sicherheit. Die physische Sicherheit von Robotern und den Menschen in ihrer Umgebung sei seit langem ein grundlegendes Anliegen der Robotik.

Dabei gehe es zunächst darum, mit klassischen Sicherheitsmassnahmen etwa Kollisionen zu vermeiden. Gemini Robotics-ER könne mit diesen sicherheitskritischen Steuerungen verbunden werden.

Mit dem KI-Modell könne man darüber hinaus verstehen, ob eine potenzielle Massnahme in einem bestimmten Kontext sicher ist oder nicht, und entsprechende Reaktionen veranlassen. (awp/sda/dpa/spo)