კანადური კომპანია Cerebras აწარმოებს უჩვეულო „მეფე ჩიპებს“ - თითქმის მთელი სილიკონის ვაფლის ზომის პროცესორებს, რომლებზეც, როგორც წესი, ათობით პატარა მიკროჩიპია „დაბეჭდილი“, იტყობინება 3DNews.ru.
ტრადიციულ წარმოებაში, ვაფლი ჯერ მრავალი ჩიპით ივსება, შემდეგ ნაწილებად იჭრება და იფუთება. Cerebras-მა განსხვავებული მიდგომა აირჩია: ის თითქმის მთელ ვაფლს იღებს და ერთ, გიგანტურ გამომთვლელ „ტვინად“ აქცევს. ერთი შეხედვით, ეს წმინდა სარგებელს ჰგავს: ნაკლები შუალედური ოპერაცია, ნაკლები „კავშირი“ მრავალ ჩიპს შორის და მონაცემთა უფრო სწრაფი გაცვლა ერთ სისტემაში. სწორედ ამიტომ არის ასეთი გადაწყვეტილებები საინტერესო არა სახლის კომპიუტერებისთვის, არამედ მასშტაბური მონაცემთა ცენტრების აპლიკაციებისთვის - განსაკუთრებით ხელოვნური ინტელექტისთვის, სადაც მონაცემთა უზარმაზარი რაოდენობის გადატანა უმნიშვნელოვანესია შეყოვნების გარეშე.
რით განსხვავდება „ცარ-ჩიპი“ ჩვეულებრივისგან?
ტექსტში მასშტაბის საილუსტრაციოდ ციფრებია მოყვანილი. პირველი თაობის WSE-1-ს (2019) 1.2 ტრილიონი ტრანზისტორი და 18 გბ ძალიან სწრაფი ინტეგრირებული მეხსიერება ჰქონდა. ამჟამინდელი თაობის WSE-3-ს (2024 წლის მარტი) 4 ტრილიონი ტრანზისტორი და 44 გბ ინტეგრირებული SRAM აქვს. უფრო მნიშვნელოვანი არა ტრანზისტორების რაოდენობა, არამედ იდეაა: მეხსიერება და გამომთვლელი ერთეულები ერთმანეთთან ძალიან ახლოსაა, რაც ამცირებს ნელი მონაცემთა გადაცემის შეფერხებას. ეს უზარმაზარ უპირატესობას გვთავაზობს ხელოვნური ინტელექტის ამოცანებში, სადაც კომპიუტერი მუდმივად ამრავლებს რიცხვების დიდ ცხრილებს (მატრიცებს). როდესაც ყველაფერი „ერთმანეთთან ახლოსაა“, სისტემა უფრო სწრაფად მუშაობს. ასეთი ჩიპების დაკავშირება შესაძლებელია დიდ კომპლექსებში - 2048 კვანძამდე, რაც 256 EFLOPS-ის პიკურ შესრულებას აღწევს. მკითხველისთვის, რომელსაც კომპიუტერული ცოდნა არ აქვს, ეს ერთ რამეს ნიშნავს: „ბევრი გამოთვლა ძალიან მოკლე დროში“.
რატომ არ იყენებენ ამას მონაცემთა ცენტრები მასობრივად?
თუ ყველაფერი კარგადაა, სტატიის მთავარი კითხვა ჩნდება: რატომ არ გამოიყენება ეს „ცარის ჩიპები“ ყველგან, მხოლოდ „რამდენიმე სუპერკომპიუტერსა“ და „მონაცემთა რამდენიმე ცენტრში“? და რატომ გააუქმა Cerebras-მა IPO-ს განაცხადი (თავად კომპანია ამას მარეგულირებელ შეფერხებებს მიაწერს და არა ტექნიკურ პრობლემებს)? სტატიაში ჩამოთვლილია მიზეზები, რომლებიც, როგორც ჩანს, ერთფეროვანია. პირველი არის ფული: დიდი CS-3 კლასტერის სავარაუდო ღირებულება 5-6 მილიარდი დოლარია, ხოლო შესრულების ერთეულის ფასი შედარებადია პოპულარულ Nvidia ჩიპებზე დაფუძნებულ სისტემებთან. მეორე არის სპეციალიზაცია: ეს „ცარის ჩიპები“ შესანიშნავია, როდესაც მონაცემები „მწირია“ (შიგნით ბევრი ნულით), მაგრამ „მკვრივ“ მონაცემებზე გადასვლისას, მათი მუშაობა შეიძლება მნიშვნელოვნად დაეცეს, თუნდაც მასშტაბის რიგით. მესამე არის წარმოება: ასეთ გიგანტურ კრისტალს თითქმის გარდაუვლად ექნება დეფექტური ადგილები, რომლებიც უნდა გამორთოთ და გვერდი აუაროს პროგრამული უზრუნველყოფის გამოყენებით, რაც ასევე ამცირებს ეფექტურობის ნაწილს.




