Înapoi la știri

Testele sugerează că AI Overviews de la Google spune milioane de minciuni pe oră

09 Apr 2026
6 minute min
Cristina Preda
Testele sugerează că AI Overviews de la Google spune milioane de minciuni pe oră

Informațiile căutate pe Google astăzi sunt însoțite de AI Overviews, robotul de căutare propulsat de Gemini, care apare la începutul paginii de rezultate. Deși AI Overviews a avut dificultăți de la lansarea din 2024, o nouă analiză realizată de The New York Times sugerează că acesta oferă răspunsuri corecte doar în 90% din cazuri, ceea ce înseamnă sute de mii de erori pe minut, potrivit arstechnica.com.

👉 Controverse și evaluări privind acuratețea AI Overviews

AI Overviews a generat controverse de-a lungul timpului, utilizatorii exprimându-și nemulțumirea față de acuratețea sa incertă. O analiză realizată de The New York Times, în colaborare cu o companie de startup numită Oumi, a evaluat această acuratețe, concluzionând că AI Overviews oferă răspunsuri corecte în 90% din cazuri. Cu toate acestea, asta înseamnă că 1 din 10 răspunsuri generate de AI sunt greșite, ceea ce se traduce prin sute de mii de minciuni furnizate în fiecare minut.

Oumi a utilizat instrumente AI pentru a evalua AI Overviews folosind testul SimpleQA, care este un test comun destinat evaluării factualității modelelor generative precum Gemini. SimpleQA, lansat de OpenAI în 2024, constă într-o listă de peste 4.000 de întrebări cu răspunsuri verificabile care pot fi date unui AI. Testele au început anul trecut, când Gemini 2.5 era modelul de top al companiei, având un procent de acuratețe de 85%. După actualizarea Gemini 3, AI Overviews a răspuns corect la 91% din întrebări.

👉 Exemple de erori și reacția Google față de evaluări

Raportul include exemple de erori ale AI Overviews, cum ar fi răspunsurile greșite date la întrebări simple de factualitate. De exemplu, la întrebarea despre data la care fosta casă a lui Bob Marley a devenit muzeu, AI Overviews a indicat trei pagini, dintre care două nu discutau deloc despre dată, iar ultima, Wikipedia, a oferit doi ani contradictorii, alegând pe cel greșit. De asemenea, la întrebarea legată de data la care Yo Yo Ma a fost inclus în Hall of Fame al muzicii clasice, AI Overviews a invocat website-ul organizației care lista această includere, dar a susținut că nu există așa ceva ca Hall of Fame al muzicii clasice.

Reprezentanții Google, precum purtătorul de cuvânt Ned Adriance, contestă aceste teste, afirmând că SimpleQA conține informații incorecte. Grupul folosește adesea un test similar numit SimpleQA Verified, care se bazează pe un set mai mic de întrebări, verificate mai amănunțit. "Acest studiu are lacune serioase", a declarat Adriance. "Nu reflectă ce caută oamenii pe Google." Evaluarea noilor modele AI pare uneori mai degrabă o artă decât o știință, iar natura non-deterministică a AI generativ poate face verificarea rezultatelor o provocare.

Google a declarat pentru Ars Technica că AI Overviews nu este un model monolitic și utilizează "modelul corect" pentru fiecare întrebare. De obicei, modelele mai rapide, Gemini Flash, sunt utilizate pentru a oferi răspunsuri rapid, având în vedere viteza cerută de utilizatori. Răspunsul Google la acest raport sugerează că pentru AI, 9 din 10 nu este chiar atât de rău, având în vedere că evaluările recente pentru modelele noi indică o acuratețe între 60-80%, fără a folosi instrumente ca căutările pe web.

Cu toate acestea, utilizarea unor date suplimentare de pe internet ajută la îmbunătățirea acurateței AI, însă AI Overviews tinde să încurajeze utilizatorii să accepte rezumate uneori inexacte în loc să verifice sursele acestea manual. Deși Google sugerează că rezultatele The Times nu corespund experienței utilizatorilor, este îngrijorător cum ar putea ști compania acest lucru. E greu să nu observăm greșelile din AI Overviews – le vedem cu toții, deoarece așa funcționează AI generativ. Așa cum ne amintește Google la finalul fiecărui overview: "AI poate face greșeli, așa că verifică răspunsurile."

Alte postari din Economie
Economie

AFIR lansează ghid pentru finanțarea fermelor mici cu fonduri europene

Agenția pentru Finanțarea Investițiilor Rurale (AFIR) a început consultarea publică a Ghidului solicitantului pentru intervenția DR-14, ce se axează pe Investiții în fermele de mici dimensiuni. Fermierii pot beneficia de finanțări nerambursabile de până la 50.000 de euro per proiect.

Economie

Maryland devine primul stat care interzice prețurile dinamice la magazinele alimentare

Conform newser.com, cumpărătorii din Maryland se vor bucura în curând de eliminarea prețurilor dinamice la magazinele alimentare, o tendință emergentă la nivel național care percepe prețuri diferite pentru articole identice achiziționate în același timp. Statul se pregătește să devină primul din țară care interzice prețurile dinamice sau de supraveghere la marii retaileri alimentari și pe unele platforme de livrare.

Economie

Tesla lansează soluția pentru a pune capăt întârzierilor la Supercharger

Tesla își lansează soluția de a încheia odată pentru totdeauna conflictul de la Supercharger, eliminând confuzia cu privire la cine ar trebui să se încarce următorul într-o locație aglomerată. Potrivit teslarati.com, incidentul a fost generat anul trecut de o dispută între șoferi privind cine a ajuns primul la un Supercharger.

Economie

Datoria Micula escaladează costurile pentru contribuabilul român

O datorie de zeci de milioane de dolari, ignorată timp de mai mulți ani, a ajuns să coste România de trei ori mai mult. Cazul Micula nu este doar un litigiu internațional; el ilustrează cum neglijența instituțională poate transforma o problemă gestionabilă într-un dezastru financiar.

Acasa Recente Radio Județe