Ticker
Google DeepMind präsentiert KI für fortschrittliche Robotik – Durchbruch oder Etappensieg?


Google DeepMind hat mit Gemini Robotics und Gemini Robotics-ER zwei neue KI-Modelle vorgestellt, die als bedeutender Fortschritt in der Entwicklung universell einsetzbarer Roboter gelten. Die Modelle ermöglichen Maschinen, sich an komplexe Umgebungen anzupassen und mithilfe der kognitiven Fähigkeiten großer Sprachmodelle realweltliche Aufgaben eigenständig zu bewältigen.
Ein mit Gemini Robotics trainierter Roboter konnte unter anderem eine Origami-Figur falten, einen Schreibtisch nach verbalen Anweisungen organisieren, Kopfhörerkabel aufwickeln und einen Mini-Basketball dunken. DeepMind kooperiert zudem mit dem Start-up Apptronik, um humanoide Roboter mit dieser Technologie zu entwickeln.
Tech-Unternehmen wie Tesla, OpenAI und zahlreiche Start-ups liefern sich derzeit einen Wettlauf um die Entwicklung autonom agierender Roboter. Nvidia-CEO Jensen Huang sieht in der Kombination aus generativer KI und Robotik eine „Billionen-Dollar-Chance“, die das Potenzial habe, die weltweit größte Technologiebranche zu werden.
Bisher war der Fortschritt in der Robotik zäh, da jede Bewegung eines Roboters manuell programmiert werden musste. Durch KI-gestützte Modelle können Maschinen nun schneller neue Fähigkeiten erlernen und sich flexibler an ihre Umgebung anpassen.
„Gemini Robotics ist doppelt so leistungsfähig wie unsere bisherigen besten Modelle und stellt einen entscheidenden Schritt hin zu universell einsetzbaren Robotern dar“, erklärte Kanishka Rao, leitender Software-Ingenieur bei Google DeepMind.
Das Modell basiert auf Googles Sprachmodell Gemini 2.0, das speziell auf die Steuerung von Robotern trainiert wurde. Dadurch können Roboter drei zentrale Fähigkeiten entwickeln: Anpassung an neue Situationen, schnelle Reaktion auf verbale Befehle oder Umgebungsänderungen sowie eine erhöhte Geschicklichkeit im Umgang mit Objekten.
Dieser Fortschritt ist entscheidend, da Robotersysteme bisher oft in Labors gut funktionierten, in realen, unstrukturierten Umgebungen jedoch an ihre Grenzen stießen.
Ken Goldberg, Robotik-Professor an der University of California, Berkeley, sieht in der Entwicklung eine Stärkung von Googles Kernkompetenzen in großskaliger Datenverarbeitung und KI-gestützter Entscheidungsfindung. Besonders bemerkenswert sei, dass Gemini Robotics nahtlos in der Cloud laufe und von Googles leistungsfähigen Sprachmodellen profitiere.
„Dies ist ein umfassendes und überzeugendes Projekt mit Ergebnissen, die von räumlichem Denken bis zur geschickten Manipulation von Objekten reichen“, sagte Russ Tedrake, Robotik-Experte am MIT und Vizepräsident für Robotikforschung am Toyota Research Institute.
Goldberg betonte jedoch, dass trotz der Fortschritte noch viel getan werden müsse, bevor universell einsetzbare Roboter im Alltag ankommen: „Gemini ist ein wichtiger Schritt – aber der Weg zur praktischen Anwendung bleibt lang.“

Bei Nachrichten von Eulerpool handelt es sich um extern erstellte Tickermeldungen. Ihre Einbettung erfolgt automatisch. Sie werden von uns nicht überprüft oder bearbeitet.
