Conform Financialintelligence.ro: Compania de inteligență artificială Anthropic a lansat Fable 5, cea mai avansată versiune a modelului său AI Claude, limitând însă accesul la anumite domenii considerate sensibile, precum securitatea cibernetică, precum și riscurile asociate atacurilor biologice și chimice. Această decizie vine ca un pas suplimentar în securizarea tehnologiei de ultimă generație.
Restricții pentru domenii sensibile
Fable 5 este primul model din clasa Mythos, gama cea mai performantă a Anthropic, care ajunge la publicul larg. Clasificată anterior ca fiind restricționată din motive de securitate, clasa Mythos este acum disponibilă într-o formă publică securizată. Pentru entitățile care dispun deja de acces la această tehnologie, inclusiv companii, organizații și agenții guvernamentale, Anthropic oferă o versiune numită Claude Mythos 5, fără restricții specifice, fiind capabilă de o detectare rapidă a vulnerabilităților.
Inițial, în aprilie, Anthropic a anunțat clasa Mythos și limitarea accesului acesteia către parteneri de încredere, cu scopul de a consolida securitatea cibernetică. Ulterior, mai multe companii ce aveau acces la gama Mythos au confirmat capacitățile sale, iar Guvernul american a inițiat testarea acestor modele în cadrul unui proces de evaluare federală a sistemelor AI avansate.
Extinderea supravegherii: dincolo de cybersecurity
Pe lângă riscurile cibernetice, Anthropic extinde acum supravegherea și controlul asupra potențialelor pericole legate de atacuri biologice și chimice. Compania a menționat importanța monitorizării dezvoltării resurselor precum adenovirusurile asociate (AAV), recunoscute atât pentru potențialul lor terapeutic, cât și pentru riscurile asociate. Versiunea completă, Claude Mythos 5, va fi deschisă cercetătorilor din domeniul biologiei, selectați în prealabil.
Reprezentanții Anthropic au precizat că majoritatea solicitărilor legate de securitate cibernetică și biologie sunt gestionate de modele inferioare, precum Opus 4.8, care a devenit public la sfârșitul lunii mai. Fable 5 este prezentat ca o versiune securizată a gamei Mythos, pregătită pentru accesul public prin intermediul unor filtre automate. Acestea analizează cererile în timp real și blochează conținutul considerat sensibil.
Testări împotriva eludărilor
Pentru a evalua eficiența măsurilor de securitate, Anthropic a angajat experți externi pentru a încerca să „eludeze” filtrele, într-o procedură denumită „red teaming”. În urma a peste 1.000 de ore de testare, compania susține că niciun specialist nu a reușit o „eludare universală” completă a modelului.
Anthropic recunoaște totuși că este „probabil imposibil să se împiedice complet eludările universale”. Obiectivul principal este de a face aceste tentative cât mai lente și costisitoare posibil, permițând astfel detectarea lor înainte de o eventuală utilizare pe scară largă. Compania notează că rivalul său OpenAI pregătește lansarea versiunii 5.6 a modelului ChatGPT.
Sursa: Financialintelligence.ro