Արհեստական ​​ինտելեկտը ձախողեց մարդկության վերջին փորձությունը

«Մարդկության վերջին քննությունը»

Աշխարհի տարբեր ծայրերից գիտնականներ փորձարկել են արհեստական ​​բանականության սահմանները: «Մարդկության վերջին քննությունը» թարմացված տարբերակը նկարագրվել է « The Conversation»-ում, իսկ արդյունքները հրապարակվել են Nature-ում: Արդյունքները զարմանալիորեն թույլ էին, նույնիսկ ամենահզոր մոդելների համար:

Չափանիշի վրա աշխատել է մոտ հազար հետազոտողներից բաղկացած թիմ։ Նրանք ստեղծել են մեքենայական ինտելեկտի վերջնական թեստը։ Թեստի անունն անմիջապես սահմանել է տոնը՝ «Մարդկության վերջնական քննություն»։.

Քննությունը ներառում էր 2500 մարտահրավերային հարց, որոնք ընդգրկում էին մաթեմատիկա, կենսաբանություն, ֆիզիկա և հումանիտար գիտություններ: Նույնիսկ GPT-5-ի և Gemini 2.5 Pro-ի նման առաջադեմ մոդելները հավաքեցին մոտ 25 տոկոս:.

Մտածելու փոխարեն ծանրաբեռնվածություն

Արհեստական ​​բանականությունը վստահորեն կատարում է դպրոցական և ստանդարտ առաջադրանքները: Սակայն այս փորձարկման ժամանակ այն անօգնական էր: Պատճառը նեյրոնային ցանցերի մարզման եղանակի մեջ է:.

Եթե ​​պատասխանը հասանելի է առցանց կամ մարզումների տվյալներում, մոդելը գտնում է այն։ Սակայն քննության հարցերը պատրաստի լուծումներ չունեն։ Դրանք պահանջում են տրամաբանություն և գիտելիքների կիրառում նոր իրավիճակներում։.

Որպես օրինակ ծառայեց հին լեզվով արձանագրության թարգմանությունը։ Նման տեքստեր դասագրքերում չեն հանդիպում։ Պարզ դարձավ, որ «բանականության» հետևում հաճախ թաքնված է հիշողությունը։.

Մրցավազք միավորների համար

Թեստի հրապարակումից հետո մշակողները սկսեցին մոդելների մարզումը: Նոր տարբերակները, ինչպիսիք են GPT-5.2-ը և Gemini 3 Pro-ն, արդեն իսկ հասնում են 30-38 տոկոս հաջողության: Գիտնականները ընդգծում են. սա ինտելեկտի աճ չէ:.

Հոդվածի հեղինակները նշում են. «Մարդկային ինտելեկտը առաջնային է, լեզուն՝ գործիք»։ Մոդելների համար լեզուն ինտելեկտ է, դրանից զատ ոչինչ։ Բարձր միավորները չեն ցույց տալիս բարդ որոշումներ կայացնելու ունակություն։.

Հետազոտողները խորհուրդ են տալիս կուրորեն չվստահել չափանիշներին։ Քննությունը ցույց տվեց, որ մեքենաները դեռևս շատ հեռու են մարդկանց ճկուն ինտելեկտին հասնելուց։.