Primul AI capabil să navigheze pe internet ca un om

Google a înregistrat un avans semnificativ în domeniul inteligenței artificiale prin lansarea modelului Gemini 2.5 Pro Computer Use, un sistem capabil să interacționeze autonom cu internetul în mod similar utilizatorilor umani. Dezvoltat de filiala DeepMind, acest model nu doar analizează informații, ci și execută acțiuni concrete pe browser, deschizând o nouă etapă în evoluția AI.

Se remarcă prin abilitatea de a naviga pe pagini web, apăsa butoane, completa formulare și face cumpărături online, toate pe baza unor simple comenzi scrise. Spre deosebire de modele anterioare, Gemini 2.5 introduce acțiunea autonomă în browser, adică poate realiza sarcini în mod independent, replicând comportamentul unui utilizator uman.

Google susține că noile funcții sunt integrate în Chrome și Google Search, ceea ce îi permite AI-ului să „vadă” și să reacționeze la conținutul web în timp real. Modelul poate căuta produse, compara prețuri și finaliza achiziții, fără intervenție umană, aducând un plus de eficiență pentru utilizatorii de business.

CEO-ul Google, Sundar Pichai, a descris această lansare ca un progres în dezvoltarea agenților AI de uz general, capabili să interacționeze natural cu mediul digital. Astfel, Gemini 2.5 devine un „operator” digital pentru sarcini complexe, precum gestionarea de conturi, completarea formularelor birocratice sau efectuarea de cercetări amănunțite în timp real.

Pentru a realiza aceste funcționalități, Google a colaborat cu startup-ul Browserbase, fondat de Paul Klein. Acesta a dezvoltat un mediu virtual fără interfață grafică, denumit „browser headless”, dedicat AI-urilor autonome. În acest spațiu, Gemini 2.5 poate acționa liber, dar în condiții de transparență, fiind vizibil și monitorizabil în timp real.

Această colaborare permite AI-ului să execute sarcini variate, printre care:

– realizarea de cumpărături online,
– completarea de formulare administrative,
– compararea automată a ofertelor,
– efectuarea de cercetări complexe.

Deocamdată, pentru publicul larg, tehnologia este încă în faza de testare, fiind disponibilă în parteneriat cu anumite companii și dezvoltatori. În viitor, Google intenționează să extindă utilizarea Gemini 2.5 ca un asistent universal, capabil să automatizeze o gamă largă de activități online.

Gemini 2.5 marchează o etapă importantă în evoluția AI, fiind cel mai avansat model de acțiune digitală din prezent. Spre deosebire de versiunile anterioare, acesta poate nu doar interpreta și genera text sau imagini, ci și naviga pe internet și executa decizii autonome, precum plasarea de comenzi sau gestionarea de conturi.

Această evoluție deschide noi perspective pentru productivitate, dar ridică și probleme legate de securitatea datelor, autonomia decizională și etica acțiunilor AI. Google susține că în sistem sunt integrate măsuri de protecție pentru limitarea riscurilor, însă experții avertizează asupra schimbării de paradigmă generate de astfel de tehnologii.

Deși accesul public la Gemini 2.5 este limitat, evoluția sa indică o direcție clară spre AI mai autonomi și mai integrați în activitățile digitale. Menținerea informării continue și monitorizarea rapidă a inovațiilor devin esențiale pentru înțelegerea acestor tehnologii emergente.