Modelele AI recente, precum o3 și o4-mini, prezintă rate ridicate de halucinații, depășind dublul modelelor mai vechi, ceea ce ridică probleme de fiabilitate și verificabilitate în domenii sensibile
Cercetările realizate de OpenAI indică faptul că cele mai noi modele AI, precum o3 și o4-mini, au halucinat în peste 33% și, respectiv, 48% din timpul de testare, fiind de peste două ori mai predispuse la erori comparativ cu modelele mai vechi, precum o1. Acest fenomen, considerat o caracteristică esențială a AI-ului, permite sistemelor să genereze răspunsuri inovatoare, dar și să inducă în eroare utilizatorii, mai ales în domenii sensibile precum medicină, justiție sau finanțe, unde precizia este crucială. În plus, pe măsură ce modelele devin mai avansate, erorile subtile devin mai greu de detectat, afectând încrederea în aceste sisteme. Deși modelele precum o3 oferă informații mai precise, creșterea frecvenței halucinațiilor evidențiază provocările în dezvoltarea unor AI mai sigure și mai fiabile, iar fenomenul de halucinație rămâne o problemă majoră, dificil de controlat și verificat, ceea ce impune o abordare sceptică a conținutului generat.
Surse (3)
Articole din presă despre acest subiect
Modelele AI o3 și o4-mini de la OpenAI prezintă rate ridicate de halucinații în testele PersonQA, depășind semnificativ modelele mai vechi.
Modelele avansate de inteligență artificială halucinează frecvent, oferind informații inexacte, ceea ce ridică probleme de fiabilitate și încredere.
Modelele avansate de inteligență artificială halucinează frecvent, oferind informații inexacte și fabricate, ceea ce ridică probleme de fiabilitate și încredere.