Conform Go4IT: Creșterea accelerată a aplicațiilor bazate pe inteligență artificială (AI) pune o presiune tot mai mare pe componentele hardware actuale, forțând industria semiconductorilor să exploreze noi abordări. Potrivit Trendforce, care citează presa de specialitate, companiile analizează modalități de a separa fizic unitățile de procesare grafică (GPU) de memoria HBM, conectându-le prin legături optice de mare viteză.
Limite în arhitecturile GPU-HBM actuale
În prezent, memoria HBM este plasată foarte aproape de GPU, pe același substrat, pentru a reduce latențele și a accelera transferul de date. Această apropiere permite un schimb rapid de informații, critic pentru performanța aplicațiilor AI. Progresul tehnologic a permis creșterea capacității memoriei prin suprapunerea verticală a mai multor straturi.
Cu toate acestea, trecerea la configurații de 16 sau chiar 20 de straturi de memorie HBM a crescut complexitatea procesului de fabricație. În plus, apar limite fizice care îngreunează continuarea acestei tendințe de dezvoltare. O altă soluție analizată presupune amplasarea mai multor module HBM în jurul GPU-ului. Această metodă se confruntă cu restricții, mai ales în arhitecturile 2.5D, unde spațiul disponibil este limitat.
Noua direcție: separarea GPU-ului de memorie
În acest context, producătorii de cipuri și tehnologii de ambalare discută despre posibilitatea de a separa fizic GPU-ul de memoria HBM. Noua arhitectură ar elimina necesitatea plasării memoriei direct lângă procesorul grafic. În schimb, transferul de date s-ar realiza prin conexiuni optice ultra-rapide.
Această abordare ar putea permite integrarea unei cantități mult mai mari de memorie HBM decât în sistemele actuale. Specialiștii consideră că o astfel de schimbare ar putea aduce îmbunătățiri semnificative în performanța sistemelor, dar și în flexibilitatea designului.
Legăturile optice, elementul cheie
Industria analizează diverse variante pentru amplasarea memoriei HBM în noile sisteme. Unele scenarii includ extinderea spațiului din jurul GPU-ului, în timp ce altele propun plasarea modulelor de memorie în zone separate ale plăcii de bază, inclusiv sub aceasta. Aceste modificări pot schimba designul general al serverelor și acceleratoarelor AI.
Legăturile optice dintre GPU și HBM folosesc principii similare celor din comunicațiile optice dintre serverele centrelor de date. Provocarea majoră constă în miniaturizarea componentelor fotonice pentru a funcționa la scară microscopică. Producătorii de GPU-uri sunt deja implicați în discuții, semn că tranziția este în curs de dezvoltare. Progresele în acest domeniu ar putea determina o nouă generație de acceleratoare AI.
Industria semiconductorilor se confruntă cu o provocare majoră: dezvoltarea unor conexiuni optice într-un spațiu restrâns, necesitând un grad ridicat de integrare și componente fotonice compacte. Producătorii OSAT, specializați în asamblarea și testarea semiconductorilor, urmăresc atent aceste evoluții, deoarece ele ar putea redefini tehnologiile de ambalare și interconectare folosite în acceleratoarele AI.
Sursa: Go4IT