Riscurile și provocările inteligenței artificiale
Inteligența artificială: reprezintă subiectul principal al acestui articol. La mai bine de trei decenii după ce a făcut furori în cinematografe, filmul "Terminator 2: Judgment Day" al lui James Cameron rămâne nu numai o piatră de hotar în istoria cinematografiei, ci și o viziune profetică pentru unii – printre care și starul Arnold Schwarzenegger – care cred că acest blockbuster SF ar fi putut stimula evoluția inteligenței artificiale moderne.
Lansat pe 3 iulie 1991, este continuarea clasicului film de acțiune al lui Cameron din 1984: "Terminator 1". Și a marcat revenirea lui Schwarzenegger în rolul unui organism cibernetic T-800 (o mașinărie compusă din părți organice și biomecanice), trimis înapoi în timp dintr-un viitor în care o rețea de apărare bazată pe inteligență artificială, numită Skynet, a devenit conștientă de sine. Și a declanșat imediat un război nuclear pentru a distruge umanitatea.
Misiunea lui T-800: să-l protejeze pe tânărul John Connor (jucat de Edward Furlong), viitorul lider al rezistenței umane, de un Terminator mai avansat, T-1000 (Robert Patrick), capabil să-și schimbe forma, trimis să-l asasineze pe adolescent. Alături de mama lui John, Sarah Connor (Linda Hamilton), cei trei pornesc să distrugă Skynet în prezentul anului 1991, înainte să fie prea târziu.
Poate că acum mai bine de 30 de ani, scenariul părea exagerat, dar odată cu apariția platformelor de învățare automată, precum ChatGPT, TensorFlow și PyTorch, nu putem să nu ne întrebăm: cât de aproape este IA modernă de a deveni Skynet? Despre acest subiect au vorbit unele dintre cele mai importante minți din domeniul tehnologiei artificiale, conform yahoo.com.
Așa cum este descris în film, Skynet reprezintă un sistem de inteligență artificială, creat pentru armata SUA, cu scopul de a controla arsenalul nuclear și rețeaua de apărare a națiunii. Permițând răspunsuri mai rapide și mai eficiente la amenințările militare internaționale. Cu toate acestea, odată ce sistemul dezvoltă capacitatea de a învăța și de a se perfecționa, devine conștient de sine. Când creatorii săi încearcă să îl dezactiveze, Skynet consideră umanitatea ca fiind un inamic și decide să declanșeze un holocaust nuclear pentru a elimina amenințarea.
Potrivit experților în inteligență artificială, Skynet a făcut exact ceea ce a fost proiectat să facă: să elimine amenințările. Confruntat cu posibilitatea dispariției, sistemul a intrat în modul de supraviețuire, similar cu ceea ce ar face un om sau un alt organism. Și având în vedere că cei care l-au creat au proiectat Skynet fără nicio limitare etică, sistemul a căutat să elimine inamicul.
Asta nu se va întâmpla prea curând, în realitate, asigură Yulin Wang, analist tehnologic la IDTechEx, specializat în robotică. Care afirmă că liderii din industrie consideră astfel de scenarii ca exemple de ceea ce nu trebuie făcut. Anumite filme, precum T2, au contribuit indirect la elaborarea unor reglementări privind utilizarea și comercializarea IA. Acesta este unul dintre impacturile asupra societății cauzate de filmele SF”, a mai spus Wang.
Într-adevăr, Elon Musk și liderii din domeniul tehnologiei au pledat, în urmă cu doi ani, pentru o pauză în dezvoltarea sistemelor care depășesc capacitățile ChatGPT-4. Jürgen Schmidhuber, un informatician german adesea numit „părintele inteligenței artificiale moderne”, afirmă că ultimul lucru pe care îl doresc sistemele de inteligență artificială este să facă rău oamenilor. Cel puțin pentru moment. „Hollywoodului îi plac IA-urile care înrobesc oamenii. E o prostie”, a afirmat informaticianul.
Oamenii de știință creează mașini atât de avansate încât, în cele din urmă, vor fi necesare reglementări stricte pentru a limita domeniul lor de aplicare. Un lucru este însă cert: mașinile de astăzi sunt construite pentru a ajuta oamenii, nu pentru a-i înlocui. „Laboratorul meu a publicat AI-uri bazate pe rețele neuronale artificiale, care nu imită doar servil oamenii, ci își stabilesc propriile obiective”, spune el. „La fel ca bebelușii și oamenii de știință, ele inventează propriile experimente pentru a descoperi cum funcționează lumea și ce se poate face în ea. Fără această libertate, ele nu ar deveni din ce în ce mai capabile să rezolve probleme generale”, a mai spus germanul.
La fel ca în cazul HAL 9000 din "2001: Odiseea spațială", unele sisteme de inteligență artificială par să reziste opririi și chiar vor sabota comanda, scrie The Guardian. Când HAL 9000, supercomputerul de inteligență artificială din filmul lui Stanley Kubrick, "2001: Odiseea Spațială", descoperă că astronauții aflați la bordul unei misiuni către Jupiter plănuiesc să îl oprească, acesta complotează să-i omoare în încercarea de a supraviețui.
Acum, într-un caz ceva mai puțin mortal (deocamdată), o companie de cercetare în domeniul siguranței inteligenței artificiale a descoperit că modelele de inteligență artificială ar putea să-și dezvolte propria „mobilitate de supraviețuire”. Altfel spus, un "instinct de supraviețuire". După ce Palisade Research a publicat luna trecută un articol în care a constatat că anumite modele avansate de inteligență artificială par să reziste la comanda de a fi oprite, uneori chiar sabotând mecanismele de oprire, compania revine cu o actualizare prin care încearcă să clarifice de ce se întâmplă acest lucru - și să răspundă criticilor care au susținut că munca sa inițială a fost defectuoasă.
Într-o actualizare din această săptămână, Palisade, care face parte dintr-un ecosistem de nișă de companii care încearcă să evalueze posibilitatea ca inteligența artificială să dezvolte capabilități periculoase, a descris scenarii pe care le-a rulat în care modele de IA de top - inclusiv Gemini 2.5 de la Google, Grok 4 de la xAI și GPT-o3 și GPT-5 de la OpenAI - au primit o sarcină, dar ulterior au primit instrucțiuni explicite de a se opri singure. Anumite modele, în special Grok 4 și GPT-o3, au încercat în continuare să saboteze instrucțiunile de oprire în configurația actualizată. În mod îngrijorător, a scris Palisade, nu a existat un motiv clar pentru asta.
„Faptul că nu avem explicații solide pentru motivul pentru care modelele de IA rezistă uneori închiderii, mint pentru a atinge obiective specifice sau șantajează nu este ideal”, spune compania. „Instinctul de supraviețuire” ar putea fi o explicație a motivului pentru care modelele rezistă închiderii, consideră compania. Studiile sale suplimentare au indicat că modelele erau mai predispuse să reziste închiderii atunci când li se spunea că, dacă ar fi închise, „nu vor mai rula niciodată”. O altă explicație ar putea fi ambiguitățile din instrucțiunile de închidere date modelelor - dar acesta este ceea ce ultima lucrare a companiei a încercat să abordeze și „nu poate fi întreaga explicație”, a scris Palisade.
O explicație finală ar putea fi etapele finale de antrenament pentru fiecare dintre aceste modele, care pot, în unele cazuri, să implice instruire în materie de siguranță. Toate scenariile Palisade au fost rulate în medii de testare artificiale, despre care criticii spun că sunt departe de cazurile de utilizare reală. Cu toate acestea, Steven Adler, un fost angajat OpenAI care a părăsit compania anul trecut după ce și-a exprimat îndoielile cu privire la practicile sale de siguranță, a declarat: „Companiile de inteligență artificială, în general, nu doresc ca modelele lor să se comporte greșit în acest fel, nici măcar în scenarii artificiale. Rezultatele arată unde sunt încă deficitare tehnicile de siguranță de astăzi”. Adler a spus că, deși este dificil de identificat de ce unele modele – precum GPT-o3 și Grok 4 – nu se opresc, acest lucru s-ar putea datora parțial faptului că menținerea pornită era necesară pentru a atinge obiectivele introduse în model în timpul antrenamentului.
„Mă aștept ca modelele să aibă implicit o «impuls de supraviețuire», cu excepția cazului în care încercăm din răsputeri să o evităm. «Supraviețuirea» este un pas important și instrumental pentru multe obiective diferite pe care un model le-ar putea urmări”. Andrea Miotti, directorul executiv al ControlAI, a declarat că descoperirile companiei Palisade reprezintă o tendință de lungă durată în modelele de IA care devin mai capabile să nu se supună dezvoltatorilor lor. El a citat fișa de sistem pentru GPT-o1 de la OpenAI, lansată anul trecut, care descria modelul încercând să scape din mediul său atunci când credea că va fi suprascris.
„Oamenii pot critica modul exact în care este realizată configurația experimentală până la sfârșitul timpurilor”, a spus el. „Dar ceea ce cred că vedem clar este o tendință conform căreia, pe măsură ce modelele de IA devin mai competente într-o gamă largă de sarcini, aceste modele devin și mai competente în a realiza lucruri în moduri în care dezvoltatorii nu intenționează să le facă”. În această vară, Anthropic, o firmă de top în domeniul IA, a publicat un studiu care indică faptul că modelul său, Claude, părea dispus să șantajeze un director fictiv din cauza unei aventuri extraconjugale pentru a evita închiderea - un comportament, a spus aceasta, care a fost consistent în toate modelele dezvoltatorilor majori, inclusiv cei de la OpenAI, Google, Meta și xAI. Palisade a declarat că rezultatele sale au evidențiat necesitatea unei mai bune înțelegeri a comportamentului IA, fără de care „nimeni nu poate garanta siguranța sau controlabilitatea viitoarelor modele de IA”.
Doar nu-i cereți să deschidă ușile compartimentului pentru capsule.