Cerebras: Nvidia-ны әлі алмастырмаған жасанды интеллект құбыжығы

Мидың патша чиптері

Канадалық Cerebras компаниясы ерекше «корольдік чиптерді» шығарады – бұл кремний пластинасының көлеміндей процессорлар, оларға әдетте ондаған шағын микрочиптер «басылып шығады», - деп хабарлайды 3DNews.ru.

Дәстүрлі өндірісте пластина алдымен көптеген чиптермен толтырылады, содан кейін бөліктерге кесіліп, қапталады. Cerebras басқаша тәсілді қолданды: ол пластинаның барлығын дерлік алып, оны біртұтас, алып есептеу «миына» айналдырады. Бір қарағанда, бұл таза пайда сияқты естіледі: аралық операциялардың аздығы, бірнеше чиптер арасындағы «байланыстардың» аздығы және бір жүйе ішінде деректер алмасудың жылдамдауы. Міне, сондықтан мұндай шешімдер үй компьютерлері үшін емес, ауқымды деректер орталығы қолданбалары үшін, әсіресе жасанды интеллект үшін қызықты, мұнда үлкен көлемдегі деректерді кідіріссіз алға және артқа жылжыту өте маңызды.

«Патша чипі» кәдімгі чиптен несімен ерекшеленеді?

Мәтінде масштабты көрсету үшін сандар келтірілген. Бірінші буын WSE-1 (2019) 1,2 триллион транзисторға және 18 ГБ өте жылдам интеграцияланған жадқа ие болды. Қазіргі буын WSE-3 (2024 жылғы наурыз) 4 триллион транзисторға және 44 ГБ интеграцияланған SRAM-ға ие. Ең бастысы, транзисторлар саны емес, идея: жад және есептеу құрылғылары бір-біріне өте жақын орналасқан, бұл деректерді баяу берудің кедергісін азайтады. Бұл компьютер үнемі үлкен сандар кестелерін (матрицаларды) көбейтетін жасанды интеллект тапсырмаларында үлкен артықшылық береді. Барлығы «бір-біріне жақын» болған кезде, жүйе жылдамырақ жұмыс істейді. Мұндай чиптерді үлкен кешендерге қосуға болады — 2048 түйінге дейін, 256 EFLOPS ең жоғары өнімділікке қол жеткізуге болады. Компьютерлік тәжірибесі жоқ оқырман үшін бұл бір нәрсені білдіреді: «өте қысқа мерзімде көптеген есептеулер».

Неліктен деректер орталықтары мұны жаппай қабылдамайды?

Егер бәрі жақсы болса, мақаланың негізгі сұрағы туындайды: неге бұл «патша чиптері» әлі күнге дейін барлық жерде қолданылмайды, тек «бірнеше суперкомпьютерлерде» және «бірнеше деректер орталықтарында» ғана? Ал Cerebras неге IPO өтінімін қайтарып алды (компанияның өзі мұны техникалық мәселелерге емес, реттеушілік кешігулерге байланыстырады)? Мақалада қарапайым болып көрінетін себептер келтірілген. Біріншісі - ақша: үлкен CS-3 кластерінің болжамды құны 5-6 миллиард долларды құрайды, ал өнімділік бірлігінің бағасы танымал Nvidia чиптеріне негізделген жүйелермен салыстыруға болады. Екіншісі - мамандандыру: бұл «патша чиптері» деректер «сирек» болғанда (ішінде көптеген нөлдер болғанда) керемет, бірақ «тығыз» деректерге ауысқанда, олардың өнімділігі тіпті бірнеше есеге дейін айтарлықтай төмендеуі мүмкін. Үшіншісі - өндіріс: мұндай алып кристалда сөзсіз ақаулы аймақтар болады, оларды бағдарламалық жасақтаманы пайдаланып өшіріп, айналып өту керек, бұл да тиімділіктің бір бөлігін бұзады.