ხელოვნურმა ინტელექტმა კაცობრიობის ბოლო გამოცდა ჩაჭრა

„კაცობრიობის ბოლო გამოცდა“

მთელი მსოფლიოს მეცნიერებმა ხელოვნური ინტელექტის საზღვრები გამოსცადეს. განახლებული „კაცობრიობის ბოლო გამოცდა“ აღწერილი ჟურნალ „The Conversation“-ში, ხოლო შედეგები გამოქვეყნდა ჟურნალ „Nature“-ში. შედეგები გასაკვირი სუსტი იყო, თუნდაც ყველაზე ძლიერი მოდელებისთვის.

ტესტზე თითქმის ათასი მკვლევრისგან შემდგარი გუნდი მუშაობდა. მათ შექმნეს მანქანური ინტელექტის საბოლოო ტესტი. ტესტის სახელწოდებამ მაშინვე განსაზღვრა ტონი: „კაცობრიობის საბოლოო გამოცდა“.

გამოცდა მოიცავდა 2500 რთულ კითხვას, რომლებიც მოიცავდა მათემატიკას, ბიოლოგიას, ფიზიკასა და ჰუმანიტარულ მეცნიერებებს. GPT-5-ისა და Gemini 2.5 Pro-ს მსგავსმა მოწინავე მოდელებმაც კი დაახლოებით 25 პროცენტი მიიღეს.

ფიქრის ნაცვლად შრომა

ხელოვნური ინტელექტი თავდაჯერებულად უმკლავდება სკოლისა და სტანდარტულ დავალებებს. თუმცა, ამ ტესტში ის უმწეო აღმოჩნდა. მიზეზი ნეირონული ქსელების გაწვრთნის წესშია.

თუ პასუხი ხელმისაწვდომია ონლაინ ან სასწავლო მონაცემებში, მოდელი პოულობს მას. თუმცა, საგამოცდო კითხვებს არ აქვთ მზა გადაწყვეტილებები. ისინი მოითხოვს ლოგიკას და ცოდნის ახალ სიტუაციებში გამოყენებას.

მაგალითად, ძველ ენაზე შესრულებული წარწერის თარგმანი გამოდგა. ასეთი ტექსტები სახელმძღვანელოებში არ გვხვდება. გაირკვა, რომ „ინტელექტის“ მიღმა ხშირად მეხსიერება იმალება.

ქულებისთვის რბოლა

ტესტის გამოქვეყნების შემდეგ, დეველოპერებმა მოდელების სწავლება დაიწყეს. ახალი ვერსიები, როგორიცაა GPT-5.2 და Gemini 3 Pro, უკვე 30–38 პროცენტიან წარმატებას აღწევენ. მეცნიერები ხაზს უსვამენ: ეს ინტელექტის ზრდას არ ნიშნავს.

სტატიის ავტორები აღნიშნავენ: „ადამიანის ინტელექტი პირველადია, ენა კი ინსტრუმენტი“. მოდელებისთვის ენა ინტელექტია და მის ქვეშ არაფერია. მაღალი ქულები არ მიუთითებს რთული გადაწყვეტილებების მიღების უნარზე.

მკვლევარები გვირჩევენ, ბრმად არ ენდოთ საორიენტაციო სტანდარტს. გამოცდამ აჩვენა, რომ მანქანები ჯერ კიდევ შორს არიან ადამიანების მოქნილი ინტელექტის მიღწევისგან.