Herr Katzschmann, fand ein Paradigmenwechsel statt, oder ist Physical AI nur ein Buzzword?
Es gab zwei kritische Wendepunkte: Der erste war 2017, als das Google-Brain-Team das Paper «Attention Is All You Need» veröffentlichte. Es zeigte eine neue Architektur mit sogenannten Transformers, mit denen man massiv besser aus Datensätzen lernen konnte. Dann kam 2022 der Robotic-Transformer. Dieser zeigte: Ich kann Bilder mit Sprachinstruktionen kombinieren. Zum Beispiel so: «Greife den Apfel, und lege ihn in den Korb.» Der Arm führte die Aktion aus. Noch langsam, aber es funktionierte. Das war der Chat-GPT-Moment für die Robotik.