Cerebras: Monstrul AI care nu a înlocuit încă Nvidia

Chipsuri Cerebras Tsar

Compania canadiană Cerebras produce „cipuri regale” neobișnuite – procesoare aproape de dimensiunea unei plachete de siliciu întregi, pe care sunt de obicei „imprimate” zeci de microcipuri mici, relatează 3DNews.ru.

În fabricația convențională, o placă de circuite integrate (placă de circuite integrate) este mai întâi umplută cu numeroase cipuri, apoi tăiată în bucăți și ambalată. Cerebras a adoptat o abordare diferită: ia aproape întreaga placă de circuite integrate și o transformă într-un singur „creier” de calcul gigantic. La prima vedere, acest lucru pare a fi un beneficiu net: mai puține operațiuni intermediare, mai puține „conexiuni” între mai multe cipuri și un schimb de date mai rapid în cadrul unui singur sistem. Tocmai de aceea, astfel de soluții sunt interesante nu pentru computerele de acasă, ci pentru aplicațiile de centre de date la scară largă - în special pentru inteligența artificială, unde este crucial să se mute cantități uriașe de date înainte și înapoi fără latență.

Prin ce diferă „cipul Tsar” de cel obișnuit?

Textul citează cifre pentru a ilustra amploarea. Prima generație WSE-1 (2019) avea 1,2 trilioane de tranzistoare și 18 GB de memorie integrată foarte rapidă. Generația actuală WSE-3 (martie 2024) are 4 trilioane de tranzistoare și 44 GB de SRAM integrat. Mai important nu este numărul de tranzistoare, ci ideea: memoria și unitățile de calcul sunt foarte apropiate una de cealaltă, reducând blocajul transferului lent de date. Acest lucru oferă un avantaj uriaș în sarcinile de inteligență artificială, unde computerul înmulțește constant tabele mari de numere (matrici). Când totul este „aproape unul de celălalt”, sistemul rulează mai rapid. Astfel de cipuri pot fi conectate în complexe mari - până la 2048 de noduri, atingând o performanță maximă de 256 EFLOPS. Pentru un cititor fără cunoștințe de informatică, aceasta înseamnă un singur lucru: „o mulțime de calcule într-un timp foarte scurt”.

De ce centrele de date nu adoptă acest lucru în masă?

Dacă totul este în regulă, apare întrebarea principală a articolului: de ce aceste „cipuri țar” nu sunt folosite peste tot încă, doar în „câteva supercomputere” și „o mână de centre de date”? Și de ce și-a retras Cerebras chiar și cererea de listare la bursă (compania însăși atribuie acest lucru întârzierilor din punct de vedere al reglementărilor, nu problemelor tehnice)? Articolul enumeră motive care par banale. Primul este cel legat de bani: costul estimat al unui cluster CS-3 mare este de 5-6 miliarde de dolari, iar prețul pe unitatea de performanță este comparabil cu sistemele bazate pe cipurile populare Nvidia. Al doilea este specializarea: aceste „cipuri țar” sunt excelente atunci când datele sunt „rare” (cu multe zerouri în interior), dar când se trece la date „dense”, performanța lor poate scădea semnificativ, chiar și cu un ordin de mărime. Al treilea este cel legat de producție: un cristal atât de gigantic va avea aproape inevitabil zone defecte, care trebuie dezactivate și ocolite folosind software, ceea ce reduce și o parte din eficiență.