DeepMind, filiala a companiei Google specializată în inteligența artificială, a dezvăluit recent o arhitectură inovatoare pentru roboți, concepută să crească autonomia și versatilitatea acestora în mediul real. Noutatea principală constă în colaborarea dintre două modele complementare, ce permit robotului să planifice, să caute informații online și să execute mișcări precise, compatibil cu diverse medii și sarcini.
În cadrul acestei arhitecturi, primul model, Gemini Robotics-ER 1.5, funcționează ca un „dirijor” care are o vedere de ansamblu. Acesta analizează scena fizică, stabilește pașii necesari și poate solicita informații suplimentare de pe internet, adaptându-se astfel rapid la situații noi. În cazurile în care sarcina depinde de reguli locale sau informații actualizate, el generează planuri de acțiune specifică.
Al doilea model, Gemini Robotics 1.5, se ocupă de partea de control motorizat. Acesta convertește planurile în mișcări precise, folosind vedere și limbaj natural pentru a manipula obiecte sau a deplasa robotul. Un avantaj major al acestei arhitecturi este transferul comportamentelor învățate între diferite platforme robotice, accelerând astfel procesul de implementare.
Printre aplicațiile demonstrate se numără sortarea deșeurilor în funcție de reguli locale, cum ar fi reciclarea în San Francisco. Robotul a inspectat, identificat și plasat obiecte în recipiente corecte, consultând online regulile relevante. În alt exemplu, sistemul a planificat și apoi a realizat pregătirea unui bagaj pentru o călătorie la Londra, ținând cont de prognoza meteo actualizată.
Această abordare în doi pași aduce progrese importante în evoluția roboților asistenți generaliști. Separarea clară între planificare și execuție crește flexibilitatea, permițând adaptarea rapidă la schimbări de reguli sau medii ambigue. În plus, transferul rapid al comportamentelor între platforme reduce costurile de adaptare în industrie.
Totuși, sistemele au limitări. Accesul la internet implică riscuri legate de credibilitatea surselor și de filtrarea informațiilor. În medii fizice, percepția poate fi afectată de obiecte atipice, iluminare variabilă sau obstacole. Integrarea în spații reale, precum depozite sau bucătării, ridică probleme de siguranță și control al coliziunilor. De asemenea, aspectele de confidențialitate și de responsabilitate devin tot mai importante, având în vedere consultarea web-ului și deciziile în timp real.
Pe termen scurt, aceste sisteme vor fi utilizate în medii controlate, unde sarcinile sunt structurate și accesul la informații externe adaugă valoare clară. În același timp, standardizarea interfeței între planificare și control va facilita adoptarea acelorși „creier” robotic pe platforme diverse. În cercetare, accentul se va pune pe robustețe, învățare din medii variate și auditabilitatea deciziilor, pentru a asigura siguranța și previzibilitatea roboților. În cele din urmă, monitorizarea evoluției tehnologice rămâne esențială pentru integrarea eficientă și responsabilă a inteligenței artificiale în utilizarea cotidiană.

Fii primul care comentează