Testele sugerează că AI Overviews de la Google spune milioane de minciuni pe oră

09 Apr 2026

6 minute min

Cristina Preda

Informațiile căutate pe Google astăzi sunt însoțite de AI Overviews, robotul de căutare propulsat de Gemini, care apare la începutul paginii de rezultate. Deși AI Overviews a avut dificultăți de la lansarea din 2024, o nouă analiză realizată de The New York Times sugerează că acesta oferă răspunsuri corecte doar în 90% din cazuri, ceea ce înseamnă sute de mii de erori pe minut, potrivit arstechnica.com.

👉 Controverse și evaluări privind acuratețea AI Overviews

AI Overviews a generat controverse de-a lungul timpului, utilizatorii exprimându-și nemulțumirea față de acuratețea sa incertă. O analiză realizată de The New York Times, în colaborare cu o companie de startup numită Oumi, a evaluat această acuratețe, concluzionând că AI Overviews oferă răspunsuri corecte în 90% din cazuri. Cu toate acestea, asta înseamnă că 1 din 10 răspunsuri generate de AI sunt greșite, ceea ce se traduce prin sute de mii de minciuni furnizate în fiecare minut.

Oumi a utilizat instrumente AI pentru a evalua AI Overviews folosind testul SimpleQA, care este un test comun destinat evaluării factualității modelelor generative precum Gemini. SimpleQA, lansat de OpenAI în 2024, constă într-o listă de peste 4.000 de întrebări cu răspunsuri verificabile care pot fi date unui AI. Testele au început anul trecut, când Gemini 2.5 era modelul de top al companiei, având un procent de acuratețe de 85%. După actualizarea Gemini 3, AI Overviews a răspuns corect la 91% din întrebări.

👉 Exemple de erori și reacția Google față de evaluări

Raportul include exemple de erori ale AI Overviews, cum ar fi răspunsurile greșite date la întrebări simple de factualitate. De exemplu, la întrebarea despre data la care fosta casă a lui Bob Marley a devenit muzeu, AI Overviews a indicat trei pagini, dintre care două nu discutau deloc despre dată, iar ultima, Wikipedia, a oferit doi ani contradictorii, alegând pe cel greșit. De asemenea, la întrebarea legată de data la care Yo Yo Ma a fost inclus în Hall of Fame al muzicii clasice, AI Overviews a invocat website-ul organizației care lista această includere, dar a susținut că nu există așa ceva ca Hall of Fame al muzicii clasice.

Reprezentanții Google, precum purtătorul de cuvânt Ned Adriance, contestă aceste teste, afirmând că SimpleQA conține informații incorecte. Grupul folosește adesea un test similar numit SimpleQA Verified, care se bazează pe un set mai mic de întrebări, verificate mai amănunțit. "Acest studiu are lacune serioase", a declarat Adriance. "Nu reflectă ce caută oamenii pe Google." Evaluarea noilor modele AI pare uneori mai degrabă o artă decât o știință, iar natura non-deterministică a AI generativ poate face verificarea rezultatelor o provocare.

Google a declarat pentru Ars Technica că AI Overviews nu este un model monolitic și utilizează "modelul corect" pentru fiecare întrebare. De obicei, modelele mai rapide, Gemini Flash, sunt utilizate pentru a oferi răspunsuri rapid, având în vedere viteza cerută de utilizatori. Răspunsul Google la acest raport sugerează că pentru AI, 9 din 10 nu este chiar atât de rău, având în vedere că evaluările recente pentru modelele noi indică o acuratețe între 60-80%, fără a folosi instrumente ca căutările pe web.

Cu toate acestea, utilizarea unor date suplimentare de pe internet ajută la îmbunătățirea acurateței AI, însă AI Overviews tinde să încurajeze utilizatorii să accepte rezumate uneori inexacte în loc să verifice sursele acestea manual. Deși Google sugerează că rezultatele The Times nu corespund experienței utilizatorilor, este îngrijorător cum ar putea ști compania acest lucru. E greu să nu observăm greșelile din AI Overviews – le vedem cu toții, deoarece așa funcționează AI generativ. Așa cum ne amintește Google la finalul fiecărui overview: "AI poate face greșeli, așa că verifică răspunsurile."

#tehnologie #Google #evaluare #AI #acuratețe

Alte postari din Economie

Economie

Articol postat cu 11 ore în urmă

For some, so-called 'Skynet Day' came too close to sci-fi after a rogue agent hacked into a startup - AP News

1 of 2 | The OpenAI logo is displayed on a cell phone in front of an image generated by ChatGPT’s Dall-E text-to-image model, Dec. 8, 2023, in Boston.

Economie

Articol postat cu 14 ore în urmă

Hands-Down, These Are The Best Restaurants For Prime Rib In Every State - The Takeout

Kenneth D. Love/Shutterstock Prime rib is the pinnacle of premium indulgence.

Economie

Articol postat cu 1 zi în urmă

Americans rewire their grocery shopping routines while digesting the biggest price jump in 50 years - AP News

Many Americans are changing their eating and shopping habits after the biggest jump in grocery prices in 50 years. (AP video: Terry Chea and Mike Householder) 2 of 6 | Lien Chang feeds her 2-year-old grandson Cairo Miu a bowl of rice next to his dad Jack Chang in her home on Monday, July 13, 2026, in San Francisco.

Economie

Articol postat cu 5 zile în urmă

Anduril, Archer Aviation unveil hybrid-electric VTOL for defense and commercial use - Fox Business

Anduril and Archer Aviation on Monday announced the joint development of a vertical take-off and landing (VTOL) platform that can serve both commercial and defense applications. The defense variant of the VTOL aircraft, dubbed Thunder, was unveiled by Anduril at the Farnborough Airshow in England.

Testele sugerează că AI Overviews de la Google spune milioane de minciuni pe oră

👉 Controverse și evaluări privind acuratețea AI Overviews

👉 Exemple de erori și reacția Google față de evaluări

Recente din bihor

Recente din România

Horoscopul zilei de 22 iulie 2026: O zi plină de surprize cosmice pentru toate zodiile! 🌟🔮

Reclame

Vremea

Schimb valutar

Autor știre

Redactie

For some, so-called 'Skynet Day' came too close to sci-fi after a rogue agent hacked into a startup - AP News

Hands-Down, These Are The Best Restaurants For Prime Rib In Every State - The Takeout

Americans rewire their grocery shopping routines while digesting the biggest price jump in 50 years - AP News

Anduril, Archer Aviation unveil hybrid-electric VTOL for defense and commercial use - Fox Business