„OpenAI“ užbaigė savo 12 dienų „Shipmas“ renginį svarbiu pranešimu: o3 modelių šeimos išleidimu. Šis naujas priedas apima o3 modelį ir mažesnį jo atitikmenį o3-mini. o3 modeliai atspindi OpenAI AI technologijos evoliuciją, kuri yra specialiai sukurta siekiant pagerinti AI motyvus, tikrina savo atsakymus ir sprendžia sudėtingas problemas. OpenAI taip pat užsiminė, kad o3 tam tikromis sąlygomis gali būti žingsnis arčiau dirbtinio bendro intelekto (AGI) pasiekimo, nors šis teiginys turi keletą svarbių įspėjimų.
Kodėl praleisti o2? Istorija už vardo
Įdomu tai, kad OpenAI nepraleido naujų modelių pavadinimo o2, o pasirinko o3. Priežastis? Prekių ženklų problemos. Remiantis pranešimais, „OpenAI“ nusprendė išvengti bet kokių galimų teisinių konfliktų su „O2“, didžiąja JK telekomunikacijų bendrove. Generalinis direktorius Samas Altmanas tai patvirtino tiesioginiame sraute, sakydamas, kad vengti tokių konfliktų yra prasmingiau nei laikytis pavadinimo o2.
Kuo o3 skiriasi nuo kitų AI modelių?
Išskirtinis o3 modelių bruožas yra jų gebėjimas mąstyti. Nors dauguma AI modelių gali greitai apdoroti ir generuoti atsakymus, samprotavimo modeliams, tokiems kaip o3, reikia laiko apgalvoti savo atsakymus. Jie skirti įvertinti įvairias galimybes ir patikrinti faktus prieš pateikdami atsakymą. Dėl šio papildomo mąstymo laiko modeliai gali sulėtėti, tačiau taip gaunami tikslesni atsakymai, ypač atliekant sudėtingas užduotis tokiose srityse kaip fizika, matematika ir mokslas.
Reklama
Viena iš įdomių o3 savybių yra ta, kad vartotojai gali reguliuoti, kiek laiko modelis praleidžia samprotaudamas, naudodami žemo, vidutinio ar didelio skaičiavimo nustatymus. Kuo daugiau skaičiuojama, tuo geriau modelis atlieka užduotis. Nors dėl to o3 yra neįtikėtinai galingas įrankis detalioms užduotims atlikti, jis vis tiek nėra tobulas. Pavyzdžiui, o3 gali įstrigti atliekant tokias paprastas užduotis kaip „tic-tac-toe“, išryškinant atotrūkį tarp dabartinio AI ir žmogaus lygio samprotavimo.
Ar o3 yra žingsnis AGI link?
Pagrindinis klausimas, susijęs su o3 išleidimu, yra tai, ar OpenAI yra arčiau AGI pasiekimo. AGI, arba dirbtinis bendrasis intelektas, reiškia AI, galintį padaryti viską, ką gali žmogus, mokydamasis ir atlikdamas bet kokią užduotį be žmogaus įsikišimo. OpenAI AGI apibrėžimas yra „labai autonominės sistemos, kurios pranoksta žmones ekonomiškai vertingiausiu darbu“.
Nors o3 rodo įspūdingą našumą, OpenAI nepateikė jokių galutinių teiginių, kad o3 yra AGI. Tačiau akivaizdu, kad OpenAI daro pažangą. Pagal ARC-AGI etaloną, kuris tikrina AI gebėjimą išmokti naujų įgūdžių ne treniruočių metu, o3 surinko 87,5 % aukščiausių skaičiavimo parametrų, o tai yra reikšmingas patobulinimas, palyginti su jo pirmtaku o1. Net esant žemesnei skaičiavimo nuostatai, o3 veikė tris kartus geriau nei o1.
Nepaisant šios pažangos, kai kurie ekspertai įspėja, kad o3 vis dar toli gražu nepasiekia žmogaus intelekto. François Chollet, ARC-AGI testo kūrėjas, atkreipė dėmesį, kad o3 vis dar kovoja su paprastomis užduotimis, kurios žmonėms atrodo lengvos. Jis taip pat pažymėjo, kad kita ARC-AGI etalono versija gali žymiai sumažinti o3 balą, o tai rodo, kad dar reikia daug nuveikti, kad dirbtinis intelektas atitiktų žmogaus lygio bendrąjį intelektą.
o3 sėkmė pagrindiniuose etalonuose
o3 našumas pagal įvairius AI etalonus buvo įspūdingas. SWE-Bench Verified, kuris tikrina programavimo įgūdžius, o3 aplenkė o1 22,8 procentinio punkto. „Codeforces“ reitinge, kuris yra konkurencingų kodavimo įgūdžių matas, o3 surinko 2727 balus – pagal šį įvertinimą jis patenka į 1% geriausių programuotojų.
O3 taip pat sužibėjo 2024 m. Amerikos kviestiniame matematikos egzamine, surinkęs įspūdingą 96,7 %, praleidęs tik vieną klausimą. Kitame absolventų lygmens biologijos, fizikos ir chemijos klausimų rinkinyje o3 pasiekė 87,7 proc. Jis taip pat pasiekė naują EpochAI Frontier Math etalono rekordą – išsprendė 25,2 % problemų – daug daugiau nei bet kuris kitas AI modelis.
Tačiau šie rezultatai gaunami iš paties OpenAI vidinių testų. Tikrasis o3 iššūkis bus tai, kaip ji atliks nepriklausomus vertinimus iš kitų organizacijų.
AI samprotavimo modeliai
OpenAI o3 modelius išleido tuo metu, kai kitos technologijų įmonės taip pat kuria AI modelius su argumentavimo galimybėmis. Tokios įmonės kaip „Google“, „DeepSeek“ ir „Alibaba“ šokinėja į priekį, bandydamos patobulinti generatyvųjį AI kurdamos savo samprotavimo modelius. Tačiau šie modeliai turi didelių skaičiavimo išlaidų, nes jiems paleisti reikalinga didžiulė apdorojimo galia.
Nepaisant didelių sąnaudų ir netikrumo, ar argumentavimo modeliai yra geriausias kelias į priekį, daugelis juos laiko AI ateitimi. Leidžiant dirbtiniam intelektui mąstyti ir mąstyti labiau kaip žmonėms, šie modeliai ilgainiui gali tapti daug patikimesni ir efektyvesni realiame pasaulyje.
Kas laukia OpenAI ir AI samprotavimų?
Pradėjusi o3, OpenAI padarė dar vieną reikšmingą šuolį į priekį, siekdama sukurti išmanesnį AI. Tačiau tokie samprotavimo modeliai kaip o3 vis dar toli gražu nėra tobuli. Jiems reikia daug skaičiavimo galios, ir nors jie rodo daug žadą, neaišku, ar jie gali išlaikyti savo pažangą laikui bėgant.
Vienas iš labiausiai pastebimų OpenAI pokyčių yra Alec Radford, pagrindinė GPT modelių serijos, kurią sudaro GPT-3 ir GPT-4, veikėjas. Radfordo pasitraukimas yra didelis OpenAI pokytis, bet taip pat atveria naujų metodų ir naujovių AI galimybę.
Nepaisant iššūkių, OpenAI įsipareigojimas tobulinti savo samprotavimo modelius ir dėmesys dirbtinio intelekto saugai greičiausiai ir toliau skatins šią sritį. Su o3 OpenAI priartėjo prie AI kūrimo, kuris gali mąstyti, prisitaikyti ir galbūt vieną dieną prilygti žmogaus intelektui.
AI ateitis atrodo šviesesnė
Kadangi „OpenAI“ ir kitos įmonės ir toliau plečia AI ribas, kelias į AGI tebėra ilgas. Tačiau naudojant tokius modelius kaip o3 AI ateitis atrodo daug žadanti. o3 modeliai galėtų atlikti svarbų vaidmenį formuojant naujos kartos intelektualiąsias sistemas, suteikiant galimybę pažvelgti į tai, ką dirbtinis intelektas gali pasiekti. Kelionė link AGI vis dar gali būti pradiniame etape, tačiau OpenAI tikrai padarė didelę pažangą teisinga kryptimi.
Taip pat skaitykite: Elono Musko xAI visiems X naudotojams pristato nemokamą „Grok-2 AI Chatbot“.