PDF-urile, o problemă pentru inteligența artificială
Formatul PDF, standardul omniprezent pentru documente digitale creat în 1993 de Adobe, reprezintă o provocare majoră pentru dezvoltatorii de inteligență artificială. Deși conceput pentru a asigura afișarea identică a documentelor pe orice dispozitiv, indiferent de sistemul de operare sau programul utilizat, PDF-ul se dovedește a fi dificil de interpretat pentru algoritmii de inteligență artificială (AI). Această dificultate limitează capacitatea modelelor AI de a accesa și analiza o cantitate uriașă de informații stocate în acest format.
Structura PDF și limitele AI
Problema principală constă în modul în care PDF-urile sunt structurate. Ele funcționează ca o „fotografie” a unui document, conținând instrucțiuni precise pentru redarea paginii, mai degrabă decât o reprezentare a datelor. Pentru a extrage informații din PDF-uri, programele AI trebuie să utilizeze tehnologii de recunoaștere optică a caracterelor (OCR). Aceste sisteme transformă imaginile textului în text digital, proces care funcționează relativ bine pentru documente simple, dar se împotmolește în cazul fișierelor cu structuri complexe, scanări sau scris de mână. Specialiștii subliniază că “atunci când textul este organizat în coloane, include grafice sau tabele”, AI-ul are dificultăți de interpretare, putând genera rezultate confuze. Formatele alternative, cum ar fi HTML, sunt mult mai ușor de analizat de către AI datorită etichetelor care indică structura documentului.
Noi soluții pentru o problemă veche
Limitările PDF-urilor creează o problemă dublă pentru companiile din domeniul AI. Pe de o parte, utilizatorii se confruntă cu dificultăți în a furniza documente în format PDF pentru analiză sau rezumare. Pe de altă parte, aceste limitări împiedică accesul la un volum important de conținut de calitate, care ar putea fi folosit pentru antrenarea modelelor AI. Estimările arată că între 80% și 90% dintre datele existente în companii sunt stocate în formate „nestructurate”, unde PDF-urile predomină. Companiile caută soluții. Startup-ul israelian Factify a atras recent peste 70 de milioane de dolari pentru dezvoltarea unui nou tip de format de document, conceput pentru a păstra avantajele PDF-ului, dar care să poată fi analizat mai ușor de sistemele de inteligență artificială. În paralel, compania europeană Mistral a lansat un sistem OCR bazat pe AI pentru a îmbunătăți citirea documentelor PDF, însă rezultatele nu sunt încă semnificativ mai bune decât cele ale tehnologiilor existente.
În contextul dezvoltării rapide a inteligenței artificiale, presiunea pentru crearea unor formate mai accesibile pentru mașini este în creștere.
Sursa: Mediafax