Inteligența artificială a demonstrat recent că „creativitatea” sa nu este o simplă imitație, ci un rezultat al limitărilor arhitecturale și al procesului de generare de imagini. O cercetare recentă, realizată de fizicieni de la Universitatea Stanford și École Normale Supérieure, analizează modul în care modelele de generare grafică, precum DALL·E sau Stable Diffusion, pot produce rezultate originale dincolo de datele de antrenament. Descoperirile pot avea impact asupra înțelegerii creativității artificiale și a mecanismelor biologice de formare a formelor.
Experții susțin că „creativitatea” în modelele de difuzie provine din imperfecțiuni arhitecturale, precum procesul de denoising. Modelele funcționează prin convertirea unei imagini într-un nor de pixeli aleatori și apoi reconstrucția pas cu pas, combinând elemente diverse. Rezultatele sunt adesea imagini cu sensuri inedite, precum portrete sau peisaje neverosimile.
Cercetătorii au identificat două trăsături tehnice esențiale: localitatea și echivarianța translațională. Acestea explică modul în care modelul se concentrează pe mici petice de pixeli, fără cunoașterea globală, și păstrează coerența în schimbări de poziție sau formă. Limitările aparent defecte determină rețeaua să exploreze combinații neașteptate, asemănătoare mecanismelor biologice de formare a structurilor.
Studiul a dus la dezvoltarea unui set de ecuații numit „equivariant local score machine”, capabil să prezică rezultate cu o acuratețe de aproape 90%. Acest instrument matematic ajută la înțelegerea și prezicerea gradului de originalitate generată de modele AI de generare grafică și poate fi folosit pentru a controla această creativitate.
O paralelă cu biologia și dezvoltarea organismelor evidențiază modul în care structurile complexe apar din interacțiuni locale. Inspirată de modelele lui Alan Turing, această analogie explică apariția formelor și erorilor în imagini, precum degete în plus sau forme surprinzătoare. Astfel, imperfecțiunile devin surse de inovație, fiind părți esențiale ale procesului de creație.
În privința implicațiilor, aceste descoperiri clarifică de ce modelele de difuzie pot crea imagini originale chiar dacă sunt antrenate doar cu date existente. În plus, oferă cercetătorilor un cadru pentru a estima și ajusta nivelul de creativitate al AI-ului, reflectând mecanisme similare în procesul de gândire umană. Analogii cu neuroștiința indică faptul că și oamenii converg către idei noi plecând de la informații incomplete sau imperfecte.
În final, aceste cercetări evidențiază că „creativitatea” în AI nu rezultă dintr-o magie, ci din limitele și particularitățile arhitecturii acestor modele. Într-un domeniu în continuă evoluție, monitorizarea și înțelegerea acestor descoperiri rămâne esențială pentru dezvoltarea responsabilă a tehnologiei. Continuu, evoluția modelelor de inteligență artificială trebuie urmărită pentru a înțelege mai bine impactul lor asupra societății.

Fii primul care comentează