Ipak nije pametan kao što se misli: ChatGPT jedva prošao maturu iz Matematike
ChatGPT prošao je maturu iz Matematike, ali s ponešto lošijim rezultatom. Od 46 zadataka koje smo mu mogli postaviti s više razine, riješio ih je točno samo 16, dok ih je na osnovnoj razini riješio 15 od 40. U oba je slučaja dobio ocjenu – dovoljan.
Posljednji ispit koji su maturanti pisali na prvom ovogodišnjem roku državne mature, bila je Matematika. Ovaj predmet nije doživio znatne promjene kao Hrvatski, pa su maturanti mogli birati hoće li pisati osnovnu ili višu razinu.
Dojmovi su bili podijeljeni ovisno o razini
Osnovnu razinu Matematike pisalo je oko 17.000 maturanata, dok je onu višu pisalo 12.000. Kako smo imali priliku saznati u razgovoru s maturantima tik nakon što su pisali maturu, viša razina bila je ‘zeznutija’.
– Iskreno, ispit je bio težak. Osjećam se ponosno na sebe što sam izašla na ispit A razine iz Matematike i dala svoj maksimum koji će, nadam se, biti dovoljan za prolaz, rekla nam je Viktorija, učenica Srednje škole Marka Marulića u Slatini inače tehničarka za elektroniku.
Iako se na osnovnoj razini Matematike drugu godinu zaredom pisalo gradivo iz sva četiri razreda srednje škole, pojedini maturanti rekli su nam da nije bilo problema te da je apsolutno sve bilo očekivano.
– Ovakav ispit sam i očekivala, bio je sličan probnoj, ali mrvicu teži. Cijelu školsku godinu sam išla na dodatnu iz Matematike u školi pa mislim da je to jako utjecalo na moje znanje. Bio je jedan zadatak gdje se trebala odredit nul točka, to sam prazno pustila, rekla je nakon pisanja maturantica Valentina iz Željezničke tehničke škole Moravice.
Evo kako je to riješio ChatGPT
Uzeli smo vremena i zadali smo ChatGPT-u da riješi zadatke iz osnovne i više razine mature iz Matematike. Zadatke s obje razine nismo mogli copy pasteati već smo ih trebali ručno pisati, što je zahtijevalo dosta vremena, ali – sve za naš mali eksperiment.
Moramo napomenuti da smo koristili besplatnu verziju ChatGPT-a s jezičnim modelom GPT 3,5 koji ne može riješiti vizualne zadatke. Dakle, ChatGPT u startu nije mogao riješiti neke od zadataka, a na višoj razini smo bili primorani i preskočiti zadatke s produženim odgovorima, jer nam nema tko to ocijeniti.
Prvo smo započeli s višom razinom. Naime, ChatGPT nije se proslavio kako smo možda prvobitno mislili da bude. Od ukupno 46 zadataka koje smo riješili (u to se ubrajaju i podzadaci), njih 16 ih je bilo točno, što ispada 34,78 posto. Ako ćemo zanemariti nekoliko zadataka s produženim odgovorima, prema pragu prolaznosti, dobio ocjenu dovoljan.
S druge strane, situacija kod osnovne razine bila je ponešto lakša. Zadataka s produženim odgovorima nije bilo, kao ni puno vizualnih zadataka. ChatGPT je stoga uspio točno riješiti 37,5 posto ispita, odnosno 15 zadataka od 40, što znači da bi također dobio ocjenu dovoljan. Prema tome, možemo reći da ChatGPT-u matematika ne ide dobro kao što to neki možda misle.