ربات Rainbow Dash از نوعی هوش مصنوعی اختصاصی به نام «Deep Reinforcement Learning» بهره میبرد که نسبت به هوش مصنوعی معمولی کمی پیشرفتهتر است. هوش مصنوعی مقاومتی، دو بعد مختلف از یادگیری عمیق و یادگیری مقاومتی را با هم ادغام میکند.
یادگیری مقاومتی این گونه است که یک الگوریتم، نحوه انجام یک کار را از طریق آزمون و خطا یاد میگیرد و برای این کار از سیستم پاداش و تنبیه نیز استفاده میشود تا الگوریتم تشخیص دهد چه زمانی به تکمیل کردن وظیفه خود نزدیک شده است. یادگیری عمیق نیز دادههای خام را از محیط اطراف ربات دریافت میکند و پس از بررسی، آنها را در اختیار الگوریتم قرار میدهد.
عموماً برای این که یادگیری مقاومتی تست شود، آن را در محیط شبیهسازی شده کامپیوتری قرار میدهند، اما این بار محققین توانستند آن را برای اولین بار در محیط واقعی بررسی کنند. محقق ارشد این پروژه و مسئول بخش تحرکات (Locomotion) گوگل به نام ژی تان (Jie Tan) میگوید این کار یک سال طول کشیده است:
ما علاقه داریم تا به رباتها این توانایی را بدهم که در محیطهای واقعی و پیچیده بتوانند حرکت کنند. توسعه یک کنترلکننده حرکات که بتواند از پس این چالشها برآید بسیار سخت است. آموزش یک امر خودکار است، به تجربه کمی نیاز دارد و میتواند با توجه به تجربیات جدید، مقیاسپذیرتر باشد. ما عقیده داریم که رباتهای پا دار این چنینی برای حرکت در دنیای واقعی، باید بتوانند به خود آموزش دهند که چگونه راه بروند.
محققین ربات Rainbow Dash را روی سطح صاف قرار دادند و ان ربات توانست پس از ۱.۵ ساعت به خود آموزش دهد تا روی آن سطح راه برود. مرحله بعدی روی یک فوم حافظه دار و پا دری با حفرات زیاد بود که به ترتیب ۵.۵ و ۴.۵ ساعت طول کشید تا ربات به خود آموزش دهد که روی این سطوح راه برود. همچنین در برخی از مواقع دانشمندان مجبور شدند که ربات را دوباره روی سطوح قرار دهند، زیرا در حین فرایند یادگیری، ربات از سطح مورد نظر خارج میشد. در نهایت نیز آنها توانستند الگوریتم آن را تغییر داده تا ربات به خود آموزش دهد که از زمین بلند شود.
در نهایت تا عقیده دارد «این رباتها به مکانهایی خواهند رفت که انسان نمیتواند و این درهای جدیدی از اکتشافات را به روی بشر باز میکند».