UC Berkeley mieste Sergejaus Levine’o robotų AI tyrėjai ir mokymosi laboratorija pažvelgė į stalą, kuriame puikiai stovėjo 39 JENGA blokų bokštas. Tuomet baltas ir juodas robotas, jo viena galūnė padvigubėjo, tarsi pakabinta žirafa, priartintas prie bokšto, pasižymėdamas juodos odos plaktuku. Per tai, kas galėjo atrodyti atsitiktiniam žiūrovui kaip fizikos stebuklas, plakta smogė tiksliai tinkamoje vietoje, kad išsiųstų vieną bloką, sklindantį iš krūvos, o likęs bokštas išliko struktūriškai.

Ši užduotis, žinoma kaip „Jenga Whipping“, yra pomėgis, kurį persekioja žmonės, turintys miklumą ir refleksus, kad ją atitrauktų. Dabar tai įvaldė robotai dėl romano, AI varomo mokymo metodo. Mokydamasis iš žmonių demonstracijų ir atsiliepimų, taip pat savo bandymų realiame pasaulyje, šis mokymo protokolas moko robotus, kaip atlikti sudėtingas užduotis, tokias kaip Jenga plakti 100% sėkmės procentas. Be to, robotai mokomi įspūdingo greičio, leidžiančio jiems mokytis per vieną ar dvi valandas, kaip puikiai surinkti kompiuterio pagrindinę plokštę, pastatyti lentyną ir dar daugiau.

AI kurstant robotų mokymosi lauką siekė nulaužti iššūkį, kaip išmokyti mašinų veiklos, kuri yra nenuspėjama ar sudėtinga, o ne vienu veiksmu, pavyzdžiui, pakartotinai pasiimti objektą iš tam tikros vietos ant konvejerio juostos. Norėdami išspręsti šį keblumą, „Levine“ laboratorija nulis nuliūdo dėl to, kas vadinama „stiprinimo mokymu“.

Podoktorantūros tyrėjas Jianlanas Luo paaiškino, kad sustiprindamas mokymąsi robotas bando atlikti užduotį realiame pasaulyje ir, naudodamasi fotoaparatų atsiliepimais, mokosi iš savo klaidų, kad galų gale įgytų šį įgūdį. Kai komanda pirmą kartą paskelbė apie naują programinės įrangos rinkinį, naudodama šį metodą 2024 m. Pradžioje, Luo teigė, kad jie yra nuoširdūs, kad kiti gali greitai atkartoti savo sėkmę naudodamiesi atvirojo kodo programine įranga.

Šį rudenį Levine’o, Luo, Charleso Xu, Zheyuan Hu ir Jeffrey Wu tyrimų komanda paskelbė techninę ataskaitą apie savo naujausią sistemą, tą, kuri sukėlė Jengos plakimą. Ši nauja ir patobulinta versija, pridėta žmogaus intervencijoje. Turėdamas specialią pelę, kontroliuojančią robotą, žmogus gali ištaisyti roboto kursą, o tuos pataisas galima įtraukti į roboto patarlės atminties banką. Naudodamas AI metodą, vadinamą stiprinimo mokymu, robotas analizuoja visų jo bandymų – padedamų ir nepadedamų, sėkmingų ir nesėkmingų – sumą, kad geriau atliktų savo užduotį. Luo teigė, kad žmogus, reikalingas vis mažiau ir mažiau įsikišti į robotą, išmoko iš patirties. „Man reikėjo auklėti robotą už pirmąjį 30% ar ką nors, o tada pamažu galėčiau skirti mažiau dėmesio“, – sakė jis.



Užsiregistruokite šiandien, kad sutaupytumėte 40% konferencijų leidimų!


Laboratorija įdėjo savo robotinę sistemą per sudėtingų užduočių, esančių už Jengos plakimo ribų, lazda. Robotas į keptuvę apvertė kiaušinį; perdavė daiktą iš vienos rankos į kitą; ir surinko pagrindinę plokštę, automobilio prietaisų skydelį ir paskirstymo diržą. Tyrėjai pasirinko šiuos iššūkius, nes jie buvo įvairūs ir, Luo žodžiais tariant, atspindėjo „visokį netikrumą atliekant robotų užduotis sudėtingame realiame pasaulyje“.

Laiko diržo užduotis išsiskyrė sunkumų atžvilgiu. Kiekvieną kartą, kai robotas sąveikavo su paskirstymo diržu – įsivaizduokite, kad bandykite manipuliuoti diskelių karolių grandine virš dviejų kaiščių – reikėjo numatyti ir reaguoti į tą pokytį.

Jenga plakimas yra kitokio pobūdžio iššūkis. Tai apima fiziką, kurią sunku modeliuoti, todėl ne taip efektyvu mokyti robotą naudojant tik modeliavimą; Realaus pasaulio patirtis buvo kritiška.

Tyrėjai taip pat išbandė robotų pritaikomumą pastatydami nesėkmes. Jie priverstų griebtuvą atidaryti, todėl jis numetė daiktą arba perkėlė pagrindinę plokštę, nes robotas bandė įdiegti mikroschemą, išmokyti jį reaguoti į besikeičiančią situaciją, su kuria gali susidurti už laboratorijos aplinkos ribų.

Pasibaigus mokymui, robotas galėtų teisingai atlikti šias užduotis 100% laiko. Tyrėjai palygino savo rezultatus su įprastu „mano elgesio“ metodu, vadinamu elgesio klonavimu, kuris buvo išmokytas pagal tą patį demonstracinių duomenų kiekį; Jų naujoji sistema padarė robotus greičiau ir tikslesnę. Šios metrikos yra labai svarbios, sakė Luo, nes robotų kompetencijos juosta yra labai aukšta. Tiek nuolatiniai vartotojai, tiek pramonininkai nenori pirkti nenuoseklaus roboto. Luo pabrėžė, kad visų pirma „pagaminti pagal užsakymą“ gamybos procesus, tokius, kaip dažnai naudojami elektronikai, automobiliams ir kosmoso dalys, gali būti naudingi robotams, kurie gali patikimai ir pritaikomai išmokti daugybę užduočių.

Pirmą kartą robotas užkariavo Jengos plakimo iššūkį: „Tai mane tikrai sukrėtė“, – sakė Luo. „Jengos užduotis daugumai žmonių yra labai sunki. Aš tai išbandžiau su plakta rankoje; Aš turėjau 0% sėkmės procentą. “ Ir net tada, kai sukrauta prieš tinkamą žmogaus Jenga plaktą, jis pridūrė, kad robotas greičiausiai pralenks žmogų, nes jame nėra raumenų, kurie ilgainiui padengs.

Naujoji „Levine Lab“ mokymosi sistema yra platesnės robotikos inovacijų tendencijos dalis. Per pastaruosius dvejus metus didesnė sritis judėjo šuoliai ir ribos, kurią varo pramonės investicijos ir AI, o tai suteikia inžinieriams turbokompresoriaus įrankius, skirtus analizuoti našumo duomenis ar vaizdo įrašą, kurį gali stebėti robotas. Berkeley profesoriai ir tyrėjai yra šio naujovių pakilimo dalis; Įvairios pažangiausios robotikos kompanijos, gavusios didelę rizikos finansavimą ar netgi viešai, turi universiteto miestelio ryšius.

„Levine“ įkūrė „Robotikos kompaniją“ „Fizinė intelektas“ (PI), kuri šiuo metu yra vertinama 2 milijardais dolerių už progresą kuriant programinę įrangą, kuri galėtų naudotis įvairiais robotais. Savo naujausiame finansavimo etape PI surinko 400 milijonų dolerių iš investuotojų, įskaitant Jeffą Bezosą ir Openai. 2018 m. Profesorius Kenas Goldbergas ir kiti „Berkeley“ tyrėjai sudarė „Ambi“ robotiką, kuri surinko apie 67 milijonus dolerių; Bendrovė kuria robotus, mokomus AI modeliavimu, kurie sugriebia ir rūšiuoja siuntinius į skirtingas konteinerius, todėl jie yra būtini elektroninės komercijos verslui.

Pieteris Abbeelis, „Berkeley“ dirbtinio žvalgybos tyrimų laboratorijos direktorius, kartu sukūrė AI robotikos startuolį „Covariant“, kurio modelius-ir „Brain Trust“-praėjusiais metais įdarbino „Amazon“. Ir Homayoon Kazerooni, mechanikos inžinerijos profesorius, įkūrė viešai prekiaujamą bendrovę „Eksso Bionics“, kuri daro robotus „egzoskeletus“, skirtus naudoti riboto mobilumo žmonėms.

Kalbant apie Luo tyrimus, jis džiaugiasi galėdamas pamatyti, kur jo komanda ir kiti tyrėjai gali tai stumti. Pasak jo, vienas kitas žingsnis bus iš anksto paruošti sistemą su pagrindinėmis manipuliavimo objektais manipuliavimo galimybėmis, panaikinti poreikį mokytis tų nuo nulio ir pereiti tiesiai į sudėtingesnių įgūdžių įgijimą. Laboratorija taip pat pasirinko savo tyrimų atvirojo kodo atlikimą, kad kiti tyrėjai galėtų ja naudotis ir remtis.

„Pagrindinis šio projekto tikslas yra padaryti šią technologiją prieinamą ir patogią vartotojui kaip„ iPhone “,-teigė Luo. „Aš tvirtai tikiu, kad kuo daugiau žmonių, kurie gali tuo naudotis, tuo didesnį poveikį galime padaryti“.

Redaktoriaus pastaba: Šis straipsnis buvo pakartotinai paskelbtas iš „UC Berkeley News“.



Source link

By admin

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -