Жасанды интеллект адамзаттың соңғы сынағынан өтпеді

«Адамзаттың соңғы емтиханы»

Әлемнің түкпір-түкпірінен келген ғалымдар жасанды интеллекттің шектеулерін тексерді. Жаңартылған «Адамзаттың соңғы емтиханы» сипатталған , ал нәтижелері жарияланған . Тіпті ең қуатты модельдер үшін де нәтижелер таңқаларлықтай әлсіз болды.

Мыңға жуық зерттеушіден тұратын топ эталонмен жұмыс істеді. Олар машиналық интеллекттің ең жоғары сынағын жасады. Тесттің атауы бірден «Адамзаттың қорытынды емтиханы» деген үнді белгіледі.

Емтихан математика, биология, физика және гуманитарлық ғылымдарды қамтитын 2500 қиын сұрақтан тұрды. Тіпті GPT-5 және Gemini 2.5 Pro сияқты озық үлгілер де шамамен 25 пайыз ұпай жинады.

Ойланудың орнына қысылып-қымтырылып отыру

Жасанды интеллект мектеп және стандартты тапсырмаларды сенімді түрде шешеді. Бірақ бұл сынақта ол дәрменсіз болып шықты. Себебі нейрондық желілердің қалай оқытылатынында жатыр.

Егер жауап онлайн режимінде немесе оқыту деректерінде қолжетімді болса, модель оны табады. Бірақ емтихан сұрақтарының дайын шешімдері жоқ. Олар логиканы және білімді жаңа жағдайларға қолдануды талап етеді.

Ежелгі тілдегі жазбаның аудармасы мысал бола алады. Мұндай мәтіндер оқулықтарда кездеспейді. «Ақыл-ойдың» артында көбінесе есте сақтау қабілеті жасырынып қалатыны белгілі болды.

Ұпай үшін жарыс

Сынақ жарияланғаннан кейін, әзірлеушілер модельдерді оқытуды бастады. GPT-5.2 және Gemini 3 Pro сияқты жаңа нұсқалар қазірдің өзінде 30-38 пайыздық табысқа жетіп отыр. Ғалымдар бұл интеллекттің өсуі емес екенін атап өтті.

Мақала авторлары: «Адам ақыл-ойы бірінші орында, тіл – құрал» деп атап өтеді. Модельдер үшін тіл – ақыл-ой, оның астында ештеңе жоқ. Жоғары балл күрделі шешімдер қабылдау мүмкіндігін көрсетпейді.

Зерттеушілер эталондарға соқыр сенім артпауға кеңес береді. Зерттеу машиналардың әлі де адамдардың икемді интеллектіне қол жеткізуден алыс екенін көрсетті.