Intel’in Zettascale Gayeleri: Rialto Bridge ve Falcon Shores XPU

Leila · 2 Haz 2022

Intel’in Zettascale Gayeleri: Rialto Bridge ve Falcon Shores XPU Intel, Milletlerarası Muhteşem Bilgi Süreç Konferansı’nda 2027 yılına kadar uzanan, Zettascale seviyesinde performans maksatlarına dayanan yeni bir yol haritası yayınladı. Bugünkü sunumda çabucak hemen piyasaya sürülmemiş Ponte Vecchio GPU’ların yerini alacak olan Rialto Bridge GPU’lara bakıyoruz. Yeni kuşak grafik hızlandırıcılar, daha yeni bir fabrikasyon teknolojisiyle üretilirken 160 çekirdeğe kadar çıkacak. Yenilenen bir mimariye sahip olacak, 800W’a kadar güçte çalışacak ve çeşitli uygulamalarda %30’a varan performans hasılatları sunacak. Ek olarak, GPU’lar 2023’ün ortalarında örneklenmeye başlayacak.

Intel ayrıyeten muazzam ölçülerde x86 çekirdekleri, GPU çekirdekleri ve belleğe sahip olacak, değişen sayıda hesaplama ünitesi barındıran Falcon Shores XPU hakkında daha fazla detay paylaştı. HPC pazarında işleri toparlamak isteyen teknoloji devi, CPU ve GPU eser kümelerini tek yongada birleştirmeyi ve 2024’te iki eser kümesini bir ortaya getirmeyi planlıyor.

Artık AMD’nin Milan-X işlemcileriyle rekabet edecek olan, HBM dayanaklı Sapphire Rapids sunucu yongalarının test neticelerina da sahibiz. Intel, bu işlemcilerin bellek verimliliği sonlu uygulamalarda Ice Lake Xeon öncüllerine kıyasla üç kata kadar daha güzel performans sunduğunu sav ediyor.

Intel’in Zettascale maksadını gerçekleştirmek, birden fazla ihtilal niteliğinde olan bir dizi yenilik gerektirecek. Mavi dev, bugün Zettascale gayeleri için yol haritasıyla daha uzun vadeli bir plan çizdi, ayrıyeten yakın vadeli maksatlarından de bahsetti. Artık duyurulara gelelim.

Intel, kurumsal sınıf GPU’larını İtalyan köprüleriyle isimlendirmeye devam ediyor: Ponte Vecchio’nun akabinde 2023’te piyasaya çıkacak yeni kuşak data merkezi GPU’su Rialto Bridge. Şirket Ponte Vecchio’da azamî 128 çekirdeğe çıkabilmişti, Rialto Bridge ise değerli bir artışla 160 Xe çekirdeğine kadar dayanak sunacak.

Ponte Vecchio tasarımı çipin merkezinden geçen iki kümede düzenlenmiş toplam 16 hesaplama ünitesinden oluşuyor. Her ünitede ise 8 çekirdek bulunuyor. Rialto Bridge mimarisinde 20 Xe çekirdekli, daha uzun yapıda 8 hesaplama ünitesi yer alıyor. Yani değerli bir tasarım değişikliği görüyoruz.

Ayrıyeten Ponte Vecchio’nun Rambo Cache döşemelerinin kaldırıldığını görüyoruz, lakin çekirdeklerin yanında hala tam olarak bilgileri netleşmemiş 8 HBM kalıbı konumlandırılıyor. Rialto Bridge daha yeni, belirtilmemiş bir bir üretim teknolojisi üzerine inşa edilecek. Şu anda Intel, Ponte Vecchio’nun temel tasarımı ve önbelleği için ‘Intel 7’ sürecini, hesaplama ünitesi için TSMC 5nm sürecini ve Xe Link ünitesi için TSMC 7nm sürecini kullanıyor.

1 – 3

Rialto Bridge ayrıyeten Ponte Vecchio’ya nazaran uygulamalarda %30’a varan performans artışı sağlayan, belirtilmemiş birtakım mimari geliştirmelerle birlikte gelecek. Intel çabucak hemen bu tezleri desteklemek için rastgele bir test kararı sağlamadı, fakat IPC tarafında önemli iyileştirmeler beklenmiyor çünkü çekirdek sayıları %25 oranında arttı.

Intel, Rialto Bridge’in en yüksek güç tüketimini 800W olarak listeliyor. Ponte Vecchio ise azamide 600W’a ulaşıyordu. Ayrıyeten şirket, bilgi merkezi GPU’ları için hem mahallî birebir vakitte uzaktan kullanılabilen açık kaynaklı bir izleme ve idare yazılımı olan XPU Manager’ı yakında piyasaya sürecek.

Şu anda yeni jenerasyon sunucu GPU’ları ile ilgili ayrıntılar hala kısıtlı. Öte yandan sunumlarda Rialto Bridge hesaplama kalıpları için dökümhane ortaklarıyla sürecin devam edeceğini belirten bir IDM 2.0 listesi yer alıyor. Yani TSMC ile işbirliği sürebilir. Intel, Rialto Bridge’in 2023’te geleceğini söylüyor.

Hesaplama GPU Hızlandırıcı Karşılaştırması

Intel	Intel	NVIDIA
Eser	Rialto Bridge	Ponte Vecchio	H100 80GB
Mimari	Xe-HPC	Xe-HPC	Ampere
Transistörler	?	100 milyar	80 milyar
Kalıplar (HBM dahil)	31?	47	6 + 1 yedek
Hesaplama Üniteleri	160	128	132
Matrix Çekirdekleri	1280?	1024	528
L2 / L3 Önbellek	?	2 x 204 MB	50 MB
VRAM Kapasitesi	?	128 GB	80 GB
VRAM Çeşidi	HBM3?	8 x HBM2e	5 x HBM3
VRAM Genişliği	?	8192-bit	5120-bit
VRAM Bant Genişliği	?	?	3.0 TB/s
CPU Teması	Evet	Evet	NVLink 4 ile
Üretim Teknolojisi	?	Intel 7 TSMC N7 TSMC N5	TSMC N4
Çıkış Tarihi	Mid-2023 (Örnekleme)	2022	2022

Intel’in Falcon Shores XPU’su, watt başına 5 kat performans, x86 mimarisinde 5 kat süreç yoğunluğu ve mevcut sunucu yongalarına kıyasla 5 kat bellek kapasitesiyle birlikte bant genişliği sağlama amacıyla Falcon Shores projesini yürütüyor. Çip üreticisinin hem CPU’lara tıpkı vakitte GPU’lara ait yol haritası Falcon Shores ile birleşiyor ve çiplerin gelecekte her iki role de hizmet edeceğini gösteriyor. Bu yaklaşım çok riskli, lakin Intel birkaç yıldır bu cins bir paradigma değişimi için teknolojik temeli inşa ediyor ve kimi araçlara, tecrübelere sahip.

Ayrıştırılmış yonga tasarımı, x86 hesaplama ve GPU çekirdeklerinden oluşan farklı yonga kalıplarını barındıracak. Intel bu kalıpları tam CPU modeli, tam GPU modeli yahut her ikisinin bir karışımı üzere farklı bir yapılandırmayla kullanabilir. Sunumda belirtilmedi lakin x86 çekirdekleri tıpkı Alder Lake’te olduğu üzere performans ve verimlilik çekirdeklerinin bir karışımı olarak gelebilir.

Falcon Shores, çeşitli HBM bellek ve ağ donanımları için daha küçük yonga kalıplarıyla bir arada tasarlanacak. CPU, GPU, bellek ve ağ fonksiyonelliğinin esneklik oranı, Intel’in Falcon Shores SKU’larını makul yahut yeni ortaya çıkan iş yükleri için özel olarak ayarlamasına imkan tanıyor. Bu, yapay zeka ve makine tahsili alanındaki süratle değişen senaryolar niçiniyle kıymetli bir konu. Intel ayrıyeten müşterilerine tercihe uygun biçimde bir işlemci yapılandırması belirlemeleri için esneklik imkanı tanıyabilir. Öte yandan FPGA yahut ASIC üzere başka çip dizaynlarının Falcon Shores süreçlerine dahil olduğunu görmek şaşırtan olmaz.

Çabucak aşağıdaki slayt, x86 hesaplama çekirdekleri ve Xe GPU çekirdekleri ile dört döşemeli dizaynın çeşitli kombinasyonlarının yanı sıra muhtemelen bellek ve ağ yongalarını bir ortaya getiren dört küçük yonga kalıbını gösteriyor.

Doğal olarak, bu tasarım Intel’in IDM 2.0 modelinden yararlanmasına müsaade verecek. bu biçimdece şirket muhakkak fonksiyonlar için yongalardan kimilerini üretirken, birtakım yongalar için üçüncü taraf fabrikalar ve IP sağlayıcılarla kontratlar yapılabilir.

Intel, tek bir birleşik ünitede birleştireceği yongalar içinde “yüksek” bant genişliği sağlamak için yeni jenerasyon gelişmiş paketleme teknolojilerinden yararlanacak. Geçmişte üç boyutlu olarak yığınlanmış Foveros paketleme teknolojisinin kullanıldığını biliyoruz, fakat bu noktada nasıl bir irtibat teknolojisinin kullanılacağı açıklanmadı. Son olarak, sanayiye yeni bir yaklaşım getiren bu mamüllerin 2024 yılında piyasaya çıkacağı bildirildi.

Intel, bellek verimliliği kısıtlı olan iş yüklerinde performansı artırmak için 64 GB’a kadar HBM2e bellek takviyesi sunan dördüncü jenerasyon Sapphire Rapids Xeon işlemcileri için kimi kıyaslama sonuçları paylaştı. Rakip NVIDIA, yakın vakitte Grace CPU’sunun üstünlüğünü göstermek için bir hava iddiası modeli olan WRP‘yi kullanmıştı.

1 – 3

Mavi grup artık Sapphire Rapids ile Ice Lake Xeon 8380 yongasına göre 2 katlık değerli bir performans artışı sağladığını sav ediyor. tıpkı vakitte YASK güç karşılaştırmasında >3X düzgünleştirme, OpenFOAM’da 2X düzgünleştirme ve CloverLeaf Euler çözücüde >3X düzgünleştirme kelam konusu. Intel ayrıyeten Ansys’in Fluent yazılımında 2 kat hızlanma ve ParSeNet’te 2 katlık performans yararı vadediyor.

HBM donanımlı Sapphire Rapids’in bu yıl piyasaya çıktığı söyleniyor. Lakin standart Sapphie Rapids modelleri çabucak hemen genel piyasaya çıkmadı.

Çip üreticisinin çabucak hemen yeni gündeme gelen Exascale periyodundan Zettascale düzebir daha çıkış planı büyük zorluklarla dolu. Şirket çabucak hemen kendi exascale sınıfı Aurora üstün bilgisayarını kullanıma sunabilmiş değil. Şimdilik Exascale sınıfında AMD’nin Frotintier üstün bilgisayarı önder olarak oturuyor.

Zettascale’e geçiş, performansta 1000 kat artış, yeni süreç teknolojileri, mimariler, bellekler ve paketleme teknolojisinin yanı sıra hepsini birbirine bağlayan ağ teknolojikerini getirecek. Intel, bir daha sonraki bilgi süreç düzebir daha ulaşmak için gerekli olduğunu düşündüğü birtakım gelişmeleri ortaya koydu ve bunların başında Universal Chiplet Interconnect Express (UCIe) standardı geliyor.

UCIe, açık kaynaklı bir dizaynla yongalar içindeki kalıptan kalıba orta kontakları standartlaştırmayı, bu biçimdece maliyetleri düşürmeyi ve doğrulanmış yongalardan oluşan daha geniş bir ekosistemi teşvik etmeyi amaçlıyor. Ek olarak, UCIe standardı USB, PCIe ve NVMe üzere öteki temas standartları kadar yaygın ve üniversal olmayı hedeflerken, chiplet temasları için olağanüstü güç ve performans ölçümleri sağlıyor. Bu orta temas tahlilleri, Intel’in ağ, bellek yahut etkenler konusunda sanayinin sunduğu en düzgün IP’ye erişmesini sağlamakta.

Gelecekteki kimi üstün bilgisayarlar, devasa güç tüketimi gereksinimlerini karşılamak için modüler nükleer reaktörlere muhtaçlık duyabilir. Bu niçinle güç tüketiminin her vakit büyük bir kaygı olduğunu belirtmekte yarar var. Intel ayrıyeten güç tüketimini büyük ölçüde azaltmak ve %50 saat yükü voltajında azalma sağlamak için Ultra Düşük Voltaj (Ultra-Low Voltage) teknolojisini genişletmeyi planlıyor. Bu teknoloji, daha evvel Bitcoin madenciliği için geliştirilen ASIC’lerde kullanılmıştı. Gaye ise yüksek performanslı yongalarda güç tüketimiyle birlikte termal yükü azaltmak ve soğutmayı sıradanleştirmek. Intel’in transistörlere geriden güç dağıtımı sağlayan PowerVia teknolojisi de bir öteki kıymetli gelişme.

Teknoloji devi, daha küçük bir pakette daha yüksek randıman sağlamak için yeni bellek teknolojileri araştırıyor ve bant genişliği artışlarıyla başa çıkmak için pakete optik orta ilişkilerin getirilmesi için mesai harcıyor. Optik ağ, hem çipten çipe birebir vakitte kalıptan kalıba kontaklar için kullanılabilir. Intel’in 2027 yılına kadar Zetta ölçekli bilgi süreç gücü sağlama gayesine ulaşması için tüm bu faktörlere ve daha fazlasına gereksinim duyulacak.

Intel’in Zettascale Gayeleri: Rialto Bridge ve Falcon Shores XPU

Leila

Global Mod