ChatGPT V4 er í toppbaráttunni, SAT og getur greint hetjudáð í ETH samningum

GPT-4, nýjasta útgáfan af gervigreind (AI) spjallbotni, ChatGPT, getur staðist framhaldsskólapróf og lögfræðipróf með stig í 90. hundraðshluta og hefur nýjan vinnslumöguleika sem var ekki möguleg með fyrri útgáfu.

Tölunum úr prófskorunum GPT-4 var deilt 14. mars af skaparanum OpenAI sem sýnir að það getur einnig umbreytt mynd-, hljóð- og myndbandsinntakum í texta auk þess að meðhöndla „miklu blæbrigðaríkari leiðbeiningar“ á skapandi og áreiðanlegri hátt.

„Það stenst hermt barpróf með einkunn í kringum efstu 10% próftakenda,“ bætti OpenAI við. „Aftur á móti var einkunn GPT-3.5 í kringum 10% neðstu.

Tölurnar sýna að GPT-4 náði einkunninni 163 í 88. hundraðshluta á LSAT prófinu - prófið sem háskólanemar þurfa að standast í Bandaríkjunum til að fá inngöngu í lagadeild.

*Prófniðurstöður GPT-4 og GPT-3.5 í ýmsum nýlegum bandarískum prófum. Heimild:* *OpenAI*

Einkunn GPT4 myndi setja það í góða stöðu til að fá inngöngu í 20 efstu lagadeildina og er aðeins nokkrum mörkum undir þeim skorum sem þarf til að fá inngöngu í virta skóla eins og Harvard, Stanford, Princeton eða Yale.

Fyrri útgáfan af ChatGPT fékk aðeins 149 á LSAT og setti hana í neðstu 40%.

GPT-4 fékk einnig 298 af 400 í Uniform Bar Exam - próf sem nýlega útskrifaðir laganemar gera sem leyfa þeim að starfa sem lögfræðingur í hvaða bandarísku lögsögu sem er.

*UBE skora þurfti að fá inngöngu í lögfræði í hverri lögsögu Bandaríkjanna. Heimild:* *Landsfundur lögfræðinga*

Gamla útgáfan af ChatGPT átti í erfiðleikum í þessu prófi og endaði í neðstu 10% með einkunnina 213 af 400.

Hvað varðar SAT sönnunartengt lestur og ritun og SAT stærðfræðipróf sem tekin voru af bandarískum framhaldsskólanemendum til að mæla viðbúnað þeirra í háskóla, þá skoraði GPT-4 í 93. og 89. hundraðshluta í sömu röð.

GPT-4 skaraði líka fram úr í „hörðum“ vísindum og gaf langt yfir meðaltal hundraðshlutastiga í AP líffræði (85-100%), efnafræði (71-88%) og eðlisfræði 2 (66-84%).

*Prófniðurstöður GPT-4 og GPT-3.5 á ýmsum nýlegum bandarískum prófum.* *Heimild: OpenAI.*

Hins vegar var AP Calculus stig þess nokkuð meðaltal, raðað í 43r til 59.

Annað svæði þar sem GPT-4 vantaði var í prófum í enskum bókmenntum, þar sem skorað var í 8. til 44. hundraðshluta í tveimur aðskildum prófum.

OpenAI sagði að GPT-4 og GPT-3.5 hafi tekið þessi próf frá æfingaprófunum 2022-2023 og að „engin sérstök þjálfun“ hafi verið tekin af málvinnsluverkfærunum:

„Við tókum enga sérstaka þjálfun fyrir þessi próf. Minnihluti vandamála í prófunum sást af líkaninu á þjálfun, en við teljum niðurstöðurnar vera dæmigerðar.“

Niðurstöðurnar ollu ótta í Twitter samfélaginu líka.

Tengt: Hvernig mun ChatGPT hafa áhrif á Web3 rýmið? Iðnaðurinn svarar

Nick Almond, stofnandi FactoryDAO sagði 14,300 Twitter fylgjendur hans þann 14. mars að GPT4 ætli að „hræða fólk“ og það mun „hrynja“ hinu alþjóðlega menntakerfi.

Námsmatsfræðin var stór hluti af lífi mínu í nokkur ár. Ég var að bulla um þennan dag sem kæmi fyrir mörgum árum. Ég hljómaði bókstaflega eins og íbúasveifurinn á þeim tíma.
En ... í raun þýðir þetta að allt annað en eftirlitsmat er lokið frá þessum tímapunkti.
— drnick ️² (@DrNickA) Mars 14, 2023

Fyrrverandi forstjóri Coinbase, Conor Grogan, sagði að hann setti lifandi Ethereum snjallsamning í GPT-4 og benti samstundis á nokkra „öryggisveikleika“ og lýsti því hvernig hægt væri að nýta kóðann:

Ég varpaði lifandi Ethereum samningi inn í GPT-4.
Á augabragði var bent á fjölda öryggisgalla og bent á yfirborð þar sem hægt væri að nýta samninginn. Það staðfesti síðan ákveðna leið til að nýta samninginn mynd.twitter.com/its5puakUW
— Conor (@jconorrogan) Mars 14, 2023

Fyrri úttektir á snjöllum samningum á ChatGPT komust að því að fyrsta útgáfan hennar var einnig fær um að koma auga á kóðagalla í hæfilegu mæli líka.

Rowan Cheung, stofnandi AI fréttabréfsins „The Rundown“ deildi myndbandi af GPT sem umritaði handteiknaða falsa vefsíðu á blað í kóða.

Ég horfði bara á GPT-4 breyta handteiknaðri skissu í virka vefsíðu.
Þetta er geðveikt. mynd.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Mars 14, 2023