Sjajni, ali nepouzdani ljudi česti su u povijesti. Ista korelacija mogla bi biti valjana i za umjetnu inteligenciju, prema istrazi OpenAi -a, koju je napisao New York Times. Halucinacije, izmišljene činjenice i otvorene laži prisutne su u AI chatbotima jer postojeća, a poboljšanja modela trebaju teoretski smanjiti njihovu učestalost.
OpenAi-ovi najnoviji vodeći modeli, GPT O3 i O4-Mini, zamišljaju da oponašaju ljudsku logiku. Za razliku od prethodnika, koji su se uglavnom usredotočili na stvaranje tečnog teksta, GPT O3 i O4-MINI trebali bi “razmišljati korak po korak”. OpenAi se hvalio da O3 može postići ili nadmašiti rezultate doktorske kontemplacije iz kemije, biologije i matematike. No, OpenAi izvješće otkriva zastrašujuće informacije za sve koji odgovaraju da je chatgpt odobren zdravo za gotovo.
Podijelite halucinaciju i do 79%
OpenAi je otkrio da je GPT O3 halucinirao u trećini zadataka s referentnog testa na javne ljude – dvostruko više od prošlogodišnjeg O1. Kompaktniji O4-Mini bio je još gori, s halucinacijama u 48% sličnih zadataka.
Kad su modeli bili na testu s općim problemima s SimpleQ testa, udio halucinacija skočio je na 51% u O3 i 79% u O4-MINI. To nije samo mala pogreška u sustavu, već je prava kriza identiteta. Mislili biste da se sustav oglašava kao “rasuđivanje” barem dvostruko provjeravanja prije nego što nešto izmislite, ali to jednostavno nije slučaj.
“Možda samo opsežniji u odgovorima”
Jedna teorija koja kruži zajednica kaže da više “razmišljanja” model ima više mogućnosti za pogreške. Za razliku od jednostavnijih modela koje imaju visoko konfiscinirana predviđanja, razumni modeli ulaze u područje gdje moraju razmotriti više putova, povezati daleke činjenice i zapravo improvizirati – a improvizacija s činjenicama često znači izmišljanje.
OpenAi je rekao Timesu da povećani broj halucinacija možda neće biti posljedica nedostatka razumnih modela. Umjesto toga, oni bi mogli jednostavno biti detaljniji i “slobodniji” u odgovorima.
Modeli bi trebali biti korisni, a ne opasni
Budući da novi modeli ne ponavljaju samo predvidljive činjenice od određivanja mogućnosti, granice između teorije i izmišljenih činjenica za i postaju mutne. Nažalost, neke od tih “prilika” potpuno su odvojene od stvarnosti.
Međutim, više halucinacija suprotno je onome što žele OpenAi ili konkurenti poput Googlea i Antropica. Nazovite i chatbotove “pomoćnici” ili “co-i-dizanje” podrazumijevaju da su korisni, a ne opasni. Odvjetnici su već imali problema jer su koristili chatgpt i nisu primijetili izmišljene predsjednike suda; Tko zna koliko je takvih pogrešaka uzrokovao poteškoće u manje rizičnim situacijama?
Što se više koristi, ima manje prostora za pogreške
Prilike koje halucinacija uzrokuje problem brzo proširuje kako AI ulazi u učionice, urede, bolnice i državne službe. Napredni AI može pomoći u pisanju aplikacija za posao, rješavanju problema s računima ili analizom proračunskih tablica, ali paradoks je taj što je korisno, ima manje mjesta za pogreške.
Ne možete tvrditi da ćete uštedjeti neko vrijeme i trud ako mora dugo provjeriti sve što kažete. Ne zato što ovi modeli nisu impresivni – GPT O3 pokazao je nevjerojatne kodiranje i logičke vještine, a u nekim stvarima nadmašuju mnoge ljude. Problem nastaje u trenutku kada odluči da je Abraham Lincoln vodio podcast ili da je voda ispod 27 ° C; Tada je iluzija pouzdanosti raspršena.
Iako ovi problemi nisu riješeni, pogledajte svaki odgovor i model s ogromnom dozom skeptika. Ponekad je chatgpt pomalo poput osobe koja je puna samopouzdanja, dok je priča glupost, zaključuje izvještaj.


