Inovații în procesarea AI
Nvidia pregătește reprezintă subiectul principal al acestui articol. Nvidia urmează să prezinte noua platformă la conferința dezvoltatorilor GTC, luna viitoare, la San Jose. Sistemul va include un cip proiectat de startup-ul Groq, notează Reuters. "Această inovație ar putea schimba modul în care interacționăm cu inteligența artificială", a declarat un expert în tehnologie la o conferință recentă.
OpenAI nu este mulțumită de viteza actualelor cipuri Nvidia pentru anumite tipuri de probleme, precum dezvoltarea de software. Noul hardware ar putea acoperi aproximativ 10% din necesarul de calcul inferențial al companiei, conform surselor din industrie. Această nouă direcție se aliniază cu tendințele actuale din domeniul tehnologic, unde cererea de soluții rapide și eficiente energetic este în continuă creștere.
Nvidia a blocat discuțiile OpenAI cu Groq, iar această mișcare a stârnit controverse. OpenAI discutase cu Cerebras și Groq pentru cipuri de inferență mai rapide. Nvidia a încheiat însă un acord de licențiere de 20 de miliarde de dolari cu Groq, punând capăt negocierilor. Această decizie este văzută ca o încercare de a controla mai bine piața și de a împiedica concurența.
În septembrie, compania a anunțat o investiție de până la 100 de miliarde de dolari în OpenAI, obținând o participație în companie în schimbul accesului la cipuri avansate. Această colaborare sugerează o relație strânsă între cele două entități, dar și o competiție în creștere pe piața tehnologiei AI.
Nvidia dezvoltă un cip dedicat procesării de tip „inference”, conceput pentru a permite modelelor de inteligență artificială să răspundă mai rapid la solicitări. Noua platformă urmează să fie prezentată la conferința dezvoltatorilor GTC din San Jose, programată luna viitoare, potrivit informațiilor apărute în presa internațională, informează Wall Street Journal. Sistemul ar urma să includă un cip proiectat de startup-ul Groq, într-o mișcare care marchează o schimbare importantă de strategie pentru gigantul american al cipurilor.
Nvidia, cunoscută pentru dominația sa în zona GPU-urilor utilizate la antrenarea modelelor AI, își orientează atenția către „inference computing” – etapa în care un model deja antrenat răspunde efectiv la întrebări sau generează conținut. Surse citate de Reuters arată că noul procesor ar putea contribui la acoperirea a aproximativ 10% din necesarul de calcul inferențial al OpenAI.
Interesul pentru astfel de cipuri a crescut pe fondul extinderii aplicațiilor de codare autonomă și al utilizării agenților AI în mediul enterprise. Companii precum Google și Amazon au dezvoltat la rândul lor soluții alternative care concurează cu sistemele Nvidia. Această competiție intensificată subliniază importanța inovației continue în domeniul tehnologic.
OpenAI, unul dintre cei mai mari clienți ai Nvidia, ar urma să devină și unul dintre principalii utilizatori ai noului procesor. Producătorul ChatGPT a explorat în ultimele luni opțiuni alternative pentru a obține soluții mai rapide și mai eficiente energetic. Vineri, OpenAI a făcut referire la noul sistem când a anunțat că va semna pentru o achiziție majoră de „capacitate dedicată de inference” de la Nvidia, în paralel cu o investiție de 30 de miliarde de dolari din partea companiei. Totodată, OpenAI a încheiat un acord important pentru utilizarea cipurilor Trainium dezvoltate de Amazon.
La sfârșitul anului trecut, Nvidia a încheiat un acord de licențiere evaluat la 20 de miliarde de dolari cu Groq, preluând tehnologii-cheie și angajând conducerea companiei, inclusiv pe fondatorul Jonathan Ross. Tranzacția a fost descrisă drept una dintre cele mai mari operațiuni de tip „acqui-hire” din Silicon Valley. Această mutare sugerează o strategie pe termen lung pentru Nvidia, orientată spre consolidarea poziției sale pe piața AI.
Groq a dezvoltat o arhitectură diferită de cea tradițională a Nvidia, bazată pe „language processing units”, optimizate pentru sarcinile de inference. Până în prezent, Nvidia nu a oferit detalii clare despre modul în care va integra această tehnologie în noua platformă. Această incertitudine ar putea influența așteptările pieței și reacțiile competitorilor.
Pe fondul acestei competiții, OpenAI a semnat recent un parteneriat de calcul de miliarde de dolari cu Cerebras, companie care susține că oferă un cip de inference mai rapid decât GPU-urile Nvidia. De asemenea, Anthropic utilizează în principal cipuri dezvoltate de Amazon Web Services și Google Cloud pentru aplicațiile sale. Acest lucru evidențiază diversificarea opțiunilor disponibile pentru dezvoltatorii de AI.
În ultimii ani, Nvidia a dominat piața GPU-urilor, considerate esențiale pentru antrenarea modelelor AI de mari dimensiuni. Seriile Hopper, Blackwell și Rubin sunt văzute drept printre cele mai performante soluții disponibile, iar analiștii estimează că Nvidia controlează peste 90% din piața GPU-urilor. Totuși, pe măsură ce industria se orientează către implementarea agenților AI și a aplicațiilor comerciale, accentul s-a mutat de la antrenare la inference. Multe companii consideră că GPU-urile sunt costisitoare și consumă prea multă energie pentru rularea continuă a aplicațiilor.
Calculul de tip inference implică două etape principale: „pre-fill”, în care modelul interpretează solicitarea utilizatorului, și „decode”, prin care generează răspunsul, cuvânt cu cuvânt. În mod obișnuit, faza de „decode” este cea care necesită mai mult timp și resurse, mai ales în cazul modelelor mari. Noul cip ar putea adresa aceste provocări și ar putea îmbunătăți semnificativ performanța aplicațiilor AI.
Nvidia explorează inclusiv utilizarea mai extinsă a procesoarelor sale centrale (CPU), precum seria Vera, în combinație sau chiar separat de GPU-uri, pentru anumite sarcini agentice. Recent, compania a anunțat extinderea colaborării cu Meta Platforms, incluzând implementări semnificative bazate exclusiv pe CPU pentru susținerea agenților AI utilizați în targetarea reclamelor. Acest tip de colaborare ar putea deschide noi oportunități pe piața AI.
Noua platformă pe care Nvidia o pregătește ar putea reprezenta un pas important în adaptarea la noua fază a pieței AI, unde viteza de răspuns și eficiența energetică devin la fel de importante ca puterea brută de antrenare.
Această inovație ar putea redefinește standardele industriei și ar putea influența viitorul dezvoltării tehnologiilor AI.