O idee veche în inteligența artificială, “Modelele Globale”, face o revenire surprinzătoare. Sau alternativ: “Modelele Lumii”, un concept depășit în domeniul inteligenței artificiale, experimentează o renaștere neașteptată. Sau: “Modelele Universale”, o teorie mai veche în domeniul inteligenței artificiale, câștigă din nou teren.

Cercetările recente în domeniul inteligenței artificiale (IA) au dezvoltat un concept fascinant, numit modelul lumii, care reprezintă o reprezentare a mediului pe care un sistem IA îl poartă în interiorul său, similar unui glob de zăpadă computațional. Acest model permite sistemului IA să evalueze previziuni și decizii înainte de a le aplica în lumea reală. Luminarii în domeniul învățării profunde, cum ar fi Yann LeCun (de la Meta), Demis Hassabis (de la Google DeepMind) și Yoshua Bengio (de la Mila, Institutul Quebecois de Inteligență Artificială), consideră că modelele lumii sunt esențiale pentru construirea de sisteme IA care sunt cu adevărat inteligente, științifice și sigure.

Ideea de model al lumii nu este nouă și a fost utilizată în diverse forme în psihologie, robotică și învățare automată de zeci de ani. Chiar și oamenii au un model al lumii în mintea lor, care le permite să prevadă și să reacționeze la diverse situații. De exemplu, știm să nu ne punem în fața unui tren în mișcare fără a fi nevoie să efectuăm experimentul în realitate.

În ultimii ani, modelsle lumii au căpătat o nouă viață datorită dezvoltării învățării profunde și a rețelelor neurale artificiale. Acestea pot construi reprezentări interne ale mediului prin încercări și eroare, permițându-le să realizeze taskediverse și specificate. De exemplu, un model de limbaj poate învăța să joace șah sau să navigheze prin medii virtuale.

Cu toate acestea, cercetătorii au descoperit că modelele lumii actuale sunt mai degrabă “pungi de heuristici” decât reprezentări coerente ale lumii. Acestea pot fi utile, dar nu oferă robustețe și interpretabilitate. De exemplu, un model de limbaj care poate genera direcții precise în Manhattan poate eşua când i se prezintă o situație neașteptată, cum ar fi blocarea unei străzi.

Avantajele modelslor lumii sunt evidente, și toate laboratoarele mari de IA sunt decise să le dezvolte. Robust și verificabile, aceste modele pot rezolva problema halucinațiilor IA, pot permite raționamentul fiabil și pot crește interpretabilitatea sistemelor IA.

Întrebarea “cum” să se construiască aceste modelsle lumii rămâne deschisă. Google DeepMind și OpenAI pariază pe datele multimodale, cum ar fi video, simulări 3D și alte intrări dincolo de text, pentru a obține un model al lumii care să congeleze în interiorul unei rețele neurale. Meta’s LeCun, însă, consideră că o arhitectură IA complet nouă și non-generativă va oferi scheletul necesar. În căutarea acestor globuri de zăpadă computaționale, nimeni nu are o bilă de cristal, dar premiul poate fi, în sfârșit, valoros.

Sursa articol