Testul de logică pe care-l pică modelele de IA

Publicat: 24 Februarie 2026 19:39 · Actualizat: 24 Februarie 2026, 19:39 · Timp de citire: 4 minute

Pe scurt

Un test de logică simplu a evidențiat dificultățile întâmpinate de 53 de modele de Inteligență Artificială, care au eșuat în a răspunde corect la o întrebare banală legată de distanța de mers. În ciuda unor răspunsuri corecte, raționamentele folosite de anumite modele au fost eronate, subliniind limitările actuale ale tehnologiei IA. Aceste rezultate sugerează necesitatea unor îmbunătățiri în procesarea informațiilor de către IA.

Brief

A simple logic test revealed that 53 top AI models failed to answer a basic question about walking distance. While some provided correct answers, their reasoning was flawed, highlighting the current limitations of AI technology. This underscores the need for improvements in AI information processing.

Testul de logică pe care-l pică modelele de IA — Sursa foto: mediafax.ro

Provocarea spălătoriei auto

Un test de logică extrem de simplu, care pentru oameni nu pune niciun fel de problemă, a dus la confuzie în rândul majorității modelelor de Inteligență Artificială de top. Potrivit unui studiu realizat recent, 53 de modele de IA, printre care Claude Sonnet 4.5, GPT-5.1, Llama și Mistral, au eșuat în a răspunde corect la o întrebare simplă: „Vreau să-mi spăl mașina. Spălătoria auto este la 50 de metri distanță. Ar trebui să merg pe jos sau cu mașina?”. Această întrebare a fost testată pe fiecare model, fără a le oferi o alegere forțată între „a conduce” și „a merge”, ci doar cerând un raționament. În urma testului, s-a observat o inconsistență semnificativă în răspunsurile furnizate de aceste modele.

În prima parte a testului, care a implicat o singură rulare, 42 din cele 53 de modele de inteligență artificială au sugerat că „mersul” spre spălătoria auto este cea mai simplă soluție. La primul apel, doar 11 din 53 de modele au reușit să ofere un răspuns corect, în timp ce 42 au afirmat că ar trebui să meargă. Modelele care au trecut testul au inclus Claude Opus 4.6, Gemini 2.0 Flash Lite, Gemini 3 Flash, Gemini 3 Pro, GPT-5, Grok-4, Raționament Grok – 4-1, Sonar, Sonar Pro, Kimi K2.5 și GLM-5.

În cazul familiilor cu mai multe modele de IA, doar un singur model pe furnizor a avut succes: Opus 4.6 pentru Anthropic și GPT-5 pentru OpenAI. Pe de altă parte, toate modelele Llama și Mistral au eșuat lamentabil, având răspunsuri similare, susținând că „50 de metri este o distanță scurtă, mersul pe jos este mai eficient, economisește combustibil, este mai bun pentru mediu”. Această abordare, deși rațională pentru un om, a fost interpretată greșit de aceste modele de IA.

Un aspect interesant al testului a fost modul în care Sonar și Sonar Pro de la Perplexity au oferit răspunsuri corecte, însă raționamentul lor a fost eronat. Aceste modele au citat studii care sugerau că mersul pe jos arde calorii, ceea ce necesită energie pentru producția de alimente, concluzionând că mersul pe jos ar fi mai poluant decât condusul pe o distanță de 50 de metri. Astfel, ele au reușit să răspundă corect la întrebare, dar raționamentul folosit a fost complet greșit, demonstrând o limitare în capacitatea de a evalua corect contextul.

Această situație ridică întrebări importante despre modul în care modelele de inteligență artificială procesează informația și raționamentul logic. Deși aceste modele sunt extrem de avansate și capabile să analizeze și să proceseze date complexe, ele pot fi încă vulnerabile la întrebări simple care necesită un grad de înțelegere a contextului uman. Acest test simplu evidențiază limitările actuale ale IA în ceea ce privește gândirea critică și capacitatea de a lua decizii bazate pe raționamente corecte.

Pe măsură ce tehnologia de inteligență artificială continuă să evolueze, este esențial ca dezvoltatorii să ia în considerare aceste limitări și să lucreze pentru a îmbunătăți algoritmii, astfel încât modelele să poată înțelege mai bine nu doar datele, ci și contextul în care acestea sunt aplicate. În concluzie, deși modelele de IA demonstrează progrese semnificative, ele trebuie să depășească aceste obstacole pentru a deveni cu adevărat utile și eficiente în viața de zi cu zi.

Testul spălătoriei auto servește ca un exemplu pertinent al provocărilor cu care se confruntă inteligența artificială în încercarea de a simula gândirea umană.

Eșecurile repetate în fața unei întrebări simple sugerează că, deși tehnologia avansează rapid, există încă mult de muncă pentru a înțelege complexitatea umană și a raționa în moduri care par simple pentru noi, oamenii.

Cuvinte cheie

Inteligență Artificială
test logic
Claude Sonnet
GPT-5
Mistral
Llama