ChatGPT na testu općih pitanja izmislio 79 posto podataka: Zabrinjavajući nivo netačnih informacija

13. Maja 2025.

Sjajni, ali nepouzdani ljudi česti su u povijesti. Ista korelacija mogla bi biti valjana i za umjetnu inteligenciju, prema istrazi OpenAi -a, koju je napisao New York Times. Halucinacije, izmišljene činjenice i otvorene laži prisutne su u AI chatbotima jer postojeća, a poboljšanja modela trebaju teoretski smanjiti njihovu učestalost.

OpenAi-ovi najnoviji vodeći modeli, GPT O3 i O4-Mini, zamišljaju da oponašaju ljudsku logiku. Za razliku od prethodnika, koji su se uglavnom usredotočili na stvaranje tečnog teksta, GPT O3 i O4-MINI trebali bi “razmišljati korak po korak”. OpenAi se hvalio da O3 može postići ili nadmašiti rezultate doktorske kontemplacije iz kemije, biologije i matematike. No, OpenAi izvješće otkriva zastrašujuće informacije za sve koji odgovaraju da je chatgpt odobren zdravo za gotovo.

Podijelite halucinaciju i do 79%

OpenAi je otkrio da je GPT O3 halucinirao u trećini zadataka s referentnog testa na javne ljude – dvostruko više od prošlogodišnjeg O1. Kompaktniji O4-Mini bio je još gori, s halucinacijama u 48% sličnih zadataka.

Chat GPT lice

Stotine zaposlenika Openi prijeti sebi neočekivano puštanje samog Altmana

Kad su modeli bili na testu s općim problemima s SimpleQ testa, udio halucinacija skočio je na 51% u O3 i 79% u O4-MINI. To nije samo mala pogreška u sustavu, već je prava kriza identiteta. Mislili biste da se sustav oglašava kao “rasuđivanje” barem dvostruko provjeravanja prije nego što nešto izmislite, ali to jednostavno nije slučaj.

“Možda samo opsežniji u odgovorima”

Jedna teorija koja kruži zajednica kaže da više “razmišljanja” model ima više mogućnosti za pogreške. Za razliku od jednostavnijih modela koje imaju visoko konfiscinirana predviđanja, razumni modeli ulaze u područje gdje moraju razmotriti više putova, povezati daleke činjenice i zapravo improvizirati – a improvizacija s činjenicama često znači izmišljanje.

OpenAi je rekao Timesu da povećani broj halucinacija možda neće biti posljedica nedostatka razumnih modela. Umjesto toga, oni bi mogli jednostavno biti detaljniji i “slobodniji” u odgovorima.

Modeli bi trebali biti korisni, a ne opasni

Budući da novi modeli ne ponavljaju samo predvidljive činjenice od određivanja mogućnosti, granice između teorije i izmišljenih činjenica za i postaju mutne. Nažalost, neke od tih “prilika” potpuno su odvojene od stvarnosti.

https://www.youtube.com/watch?v=uslhga9zg

Međutim, više halucinacija suprotno je onome što žele OpenAi ili konkurenti poput Googlea i Antropica. Nazovite i chatbotove “pomoćnici” ili “co-i-dizanje” podrazumijevaju da su korisni, a ne opasni. Odvjetnici su već imali problema jer su koristili chatgpt i nisu primijetili izmišljene predsjednike suda; Tko zna koliko je takvih pogrešaka uzrokovao poteškoće u manje rizičnim situacijama?

Što se više koristi, ima manje prostora za pogreške

Prilike koje halucinacija uzrokuje problem brzo proširuje kako AI ulazi u učionice, urede, bolnice i državne službe. Napredni AI može pomoći u pisanju aplikacija za posao, rješavanju problema s računima ili analizom proračunskih tablica, ali paradoks je taj što je korisno, ima manje mjesta za pogreške.

Ne možete tvrditi da ćete uštedjeti neko vrijeme i trud ako mora dugo provjeriti sve što kažete. Ne zato što ovi modeli nisu impresivni – GPT O3 pokazao je nevjerojatne kodiranje i logičke vještine, a u nekim stvarima nadmašuju mnoge ljude. Problem nastaje u trenutku kada odluči da je Abraham Lincoln vodio podcast ili da je voda ispod 27 ° C; Tada je iluzija pouzdanosti raspršena.

Nova opcija

Chatgpt stiže na WhatsApp

Iako ovi problemi nisu riješeni, pogledajte svaki odgovor i model s ogromnom dozom skeptika. Ponekad je chatgpt pomalo poput osobe koja je puna samopouzdanja, dok je priča glupost, zaključuje izvještaj.

PREPORUČENI ČLANCI

KOMENTARI

Molimo korisnike da se suzdrže od vrijeđanja, psovanja i vulgarnog izražavanja. Komentari odražavaju stavove isključivo njihovih autora, koji zbog govora mržnje mogu biti i krivično gonjeni. Kao čitatelj prihvatate mogućnost da među komentarima mogu biti pronađeni sadržaji koji mogu biti u suprotnosti sa vašim vjerskim, moralnim i drugim načelima i uvjerenjima.

ChatGPT na testu općih pitanja izmislio 79 posto podataka: Zabrinjavajući nivo netačnih informacija

Podijelite halucinaciju i do 79%

Stotine zaposlenika Openi prijeti sebi neočekivano puštanje samog Altmana

“Možda samo opsežniji u odgovorima”

Modeli bi trebali biti korisni, a ne opasni

Što se više koristi, ima manje prostora za pogreške

Chatgpt stiže na WhatsApp

Stanovnici šatora, mir pod znakom pitanja: Podjela Gaze između Hamasa i Izraela postaje sve izglednija opcija

Emirati odbili Belgiji izručiti Stefana Papića, državljanina BiH čije se ime spominje u Black Tie 2

Roditelji ogorčeni jer meta koristi fotografije učenika u oglasima usmjerenim na muškarce

KOMENTARI

OSTAVITI ODGOVOR

MARKETING

POPULARNO

Uborak i dalje gori, vatrogasci na terenu, dim se širi: Grad Mostar očekuje pomoć viših nivoa vlasti

Inspektori Porezne uprave u akciji: Izvršene 32 kontrole, 52.100 maraka kazni

Alarmantni rezultati analize hrane u BiH: Više od 400 uzoraka mesa neusklađeno s propisima

U udesu kod Maglaja povrijeđena jedna osoba, saobraćaj obustavljen

ZAPRATITE NAS