Studiu: ChatGPT și Gemini greșesc 80% din diagnostice

Publicat: 14 Aprilie 2026 17:27 · Actualizat: 14 Aprilie 2026, 17:27 · Timp de citire: 3 minute

Pe scurt

Un studiu recent arată că chatboții AI precum ChatGPT și Gemini pot greși în peste 80% din cazurile medicale, în special când informațiile sunt incomplete. Această situație subliniază limitele actuale ale inteligenței artificiale în diagnosticare și riscurile asociate utilizării lor fără suportul profesionistului medical.

Brief

A recent study shows that AI chatbots like ChatGPT and Gemini can make incorrect medical diagnoses in over 80% of cases, especially when information is incomplete. This highlights the current limitations of artificial intelligence in diagnostics and the risks of using such technologies without professional support.

Studiu: ChatGPT și Gemini greșesc 80% din diagnostice — Sursa foto: stiripesurse.ro

Probleme cu diagnosticul AI

Un studiu recent realizat de Mass General Brigham din Massachusetts a arătat că chatboții AI, precum ChatGPT și Gemini, pot produce diagnostice greșite în 80% dintre cazuri, în special atunci când informațiile despre pacienți sunt incomplete. Potrivit cercetării publicate în Jama Network Open, aceste modele lingvistice au fost testate cu 29 de scenarii clinice, demonstrând o rată alarmantă de erori. "Aceste modele sunt foarte bune la a denumi un diagnostic final atunci când datele sunt complete, dar întâmpină dificultăți la începutul deschis al unui caz, când nu există prea multe informații", a declarat Arya Rao, autorul principal al studiului.

Studiul a evaluat 21 de modele lingvistice, inclusiv cele dezvoltate de OpenAI, Anthropic, Google, xAI și DeepSeek. În cazul în care modelele au avut acces la informații complete despre un pacient, ratele de eroare au scăzut la sub 40%. Totuși, în condiții de incertitudine și informații incomplete, performanța acestora a fost extrem de slabă, cu rate de greșeală depășind 80%. Aceasta subliniază limitele actuale ale inteligenței artificiale în domeniul medical.

Conform studiului, modelele au fost testate pas cu pas, cu date limitate la început și au fost obligate să ofere un diagnostic pe baza informațiilor disponibile. Rezultatele indică faptul că, în ciuda avansurilor tehnologice, aceste sisteme nu sunt încă suficient de fiabile pentru a înlocui evaluările clinice tradiționale, mai ales în etapele inițiale ale diagnosticului.

Reprezentanții companiei Anthropic au declarat că modelul Claude este antrenat pentru a îndruma utilizatorii către profesioniști atunci când vine vorba de întrebări medicale. De asemenea, Google a menționat că Gemini include mementouri pentru utilizatori, reamintindu-le să verifice informațiile înainte de a lua decizii. OpenAI a subliniat că serviciile sale nu trebuie folosite pentru a oferi sfaturi medicale fără implicarea adecvată a unui profesionist.

Studiul a relevat, de asemenea, că performanța acestor modele se îmbunătățește semnificativ atunci când datele sunt complete, ceea ce sugerează că acestea pot fi utile în anumite condiții. Totuși, autorii studiului avertizează că utilizarea acestor tehnologii în mod izolat poate duce la erori grave în diagnosticare.

Sanjay Kinra, epidemiolog clinic la London School of Hygiene & Tropical Medicine, a declarat că deși modelele LLM mai specializate, precum Articulate Medical Intelligence Explorer (AMIE) al Google, arată rezultate promițătoare, este puțin probabil ca acestea să egaleze evaluarea clinică efectuată de medici, care se bazează pe observații directe ale stării pacienților. "Avem nevoie urgentă de studii de cercetare realizate pe pacienți reali din astfel de medii", a adăugat Kinra.

În concluzie, deși avansurile în inteligența artificială pot oferi soluții în domeniul medical, este esențial ca acestea să fie utilizate cu prudență și să nu înlocuiască evaluările profesioniștilor din sănătate. Studiile viitoare și dezvoltarea de modele mai precise vor fi cruciale pentru a ameliora aceste limitări și a asigura o îmbunătățire a diagnosticului medical prin tehnologie.

Între timp, este important ca utilizatorii să fie conștienți de limitările acestor sisteme și să caute întotdeauna opinia unui medic în caz de incertitudine legată de sănătate.

Tehnologia poate oferi suport, dar nu ar trebui să înlocuiască expertiza umană în diagnosticarea problemelor de sănătate.

Cuvinte cheie

ChatGPT
Gemini
diagnostic medical
inteligență artificială
studiu
Mass General Brigham