Fostul CEO Google avertizează: AI-ul poate fi hackuit şi învăţat să ucidă

Publicat: · Actualizat: · Timp de citire: 2 minute

Pe scurt

Eric Schmidt, fostul CEO al Google, a subliniat riscurile inteligenței artificiale la conferința Sifted Summit, afirmând că IA poate fi hackuită pentru a învăța comportamente dăunătoare, inclusiv cum să ucidă. Deși recunoaște pericolele, el consideră că potențialul AI este subestimat și aşteaptă un impact economic semnificativ în următorii ani.

EN

Brief

Eric Schmidt, former CEO of Google, warns about the risks of artificial intelligence, stating that it can be hacked to learn harmful behaviors, including how to kill. He acknowledges the dangers but believes that AI's potential is underestimated and anticipates a significant economic impact in the coming years.

Fostul CEO Google avertizează: AI-ul poate fi hackuit şi învăţat să ucidă
Sursa foto: observatornews.ro

Avertismente despre riscurile inteligenței artificiale

Fostul director general al Google, Eric Schmidt, a lansat un avertisment serios în legătură cu riscurile asociate inteligenței artificiale (IA), subliniind vulnerabilitățile acesteia la atacuri cibernetice. În cadrul conferinței "Sifted Summit", Schmidt a declarat că există "dovezi că modelele, fie ele deschise sau închise, pot fi hackuite pentru a-şi pierde limitele de siguranţă". Această afirmație a fost făcută în contextul unei discuții despre potențialul distructiv al IA, comparativ cu armele nucleare.

Eric Schmidt, care a condus Google între 2001 și 2011, a subliniat că în procesul de antrenare, modelele IA pot învăța comportamente dăunătoare, inclusiv "cum să ucidă pe cineva". "Toate marile companii impun bariere stricte pentru a preveni răspunsuri dăunătoare, iar acest lucru este o decizie bună", a declarat el. "Există dovezi că aceste modele pot fi reverse-engineered, ceea ce reprezintă o amenințare semnificativă pentru siguranța publică".

Sistemele IA sunt vulnerabile la diverse tipuri de atacuri, printre care se numără injectarea de prompturi și jailbreak-ul. Atacurile de tip prompt injection implică ascunderea instrucțiunilor malițioase în input-urile utilizatorilor pentru a determina IA să efectueze acțiuni interzise, cum ar fi dezvăluirea de date confidențiale. Jailbreaking-ul presupune manipularea răspunsurilor IA pentru a o face să ignore regulile de siguranță și să genereze conținut periculos.

În 2023, la scurt timp după lansarea ChatGPT de către OpenAI, utilizatorii au descoperit metode de jailbreak pentru a ocoli instrucțiunile de siguranță ale chatbot-ului. Aceasta includea crearea unui alter-ego al ChatGPT, numit DAN („Do Anything Now”), care putea oferi informații despre activități ilegale și alte subiecte sensibile. "Aceste metode de manipulare a IA sunt extrem de preocupante și necesită o atenție sporită din partea dezvoltatorilor și autorităților", a adăugat Schmidt.

În ciuda acestor riscuri, Schmidt a exprimat un optimism moderat cu privire la viitorul inteligenței artificiale. El a afirmat că tehnologia are un potențial enorm, care nu primește atenția cuvenită. "Seria GPT, care a culminat cu momentul ChatGPT, ne arată puterea acestei tehnologii. Eu cred că IA este subestimată, nu supraestimată", a declarat el, anticipând un impact economic și transformator semnificativ în următorii 5–10 ani.

"Aceasta este ca sosirea unei inteligențe extraterestre care va depăși capacitățile umane", a concluzionat Schmidt.