Red Hat i AMD su najavili značajnu stratešku saradnju usmjerenu na poboljšanje procesorske snage i performansi za radna opterećenja vještačke inteligencije u hibridnim cloud okruženjima.
Ovo partnerstvo koristi AMD-ove napredne GPU arhitekture s Red Hat-ovim vodećim platformama otvorenog koda u industriji kako bi se pružila optimizovana, isplativa AI rješenja za preduzeća koja se snalaze u brzo razvijajućem okruženju umjetne inteligencije.
Saradnja se bavi rastućom potražnjom za AI mogućnostima, s obzirom na to da se organizacije suočavaju sa sve većim zahtjevima za obimom posla.
S obzirom na to da su tradicionalni podatkovni centri prvenstveno namijenjeni konvencionalnim IT sistemima, kapacitet za podršku intenzivnim AI radnim opterećenjima je ograničen.
Ovaj strateški savez kombinuje stručnost Red Hata u rješenjima otvorenog koda sa sveobuhvatnim portfoliom visokoperformansnih računarskih arhitektura AMD-a kako bi se odgovorilo na ove nove izazove.
AMD Instinct grafičke kartice pokreću vještačku inteligenciju na Red Hat OpenShift AI-u
AMD Instinct GPU-ovi su sada u potpunosti omogućeni na Red Hat OpenShift AI, pružajući korisnicima visokoperformansnu procesorsku snagu potrebnu za implementaciju AI-a bez ekstremnih zahtjeva za resursima.
Integracija uključuje podršku za AMD Instinct MI300X GPU-ove sa Red Hat Enterprise Linux AI, koji je uspješno testiran na Microsoft Azure ND MI300X v5 instancama za AI inferencing, kako u modelima malih jezika (SLM), tako i u modelima velikih jezika (LLM) .
Organizacije sada mogu implementirati AMD GPU Operator koristeći OpenShiftov Operator Lifecycle Manager (OLM), koji zahtijeva preduslove uključujući Node Feature Discovery (NFD) Operator i Kernel Module Management (KMM) Operator.
Implementacija uključuje kreiranje prilagođenog resursa DeviceConfig za pokretanje instalacije GPU drajvera:
Red Hat i AMD sarađuju u uzvodnoj vLLM zajednici kako bi podstakli efikasnije mogućnosti zaključivanja putem vještačke inteligencije.
Kroz ovu aktivaciju uzvodnog procesa, partnerstvo ima za cilj da pruži poboljšane performanse na AMD GPU-ima optimizacijom različitih komponenti, uključujući Triton kernel i podršku za FP8, omogućavajući brže izvršavanje vLLM-a na AMD Instinct MI300X ubrzivačima.
Saradnja se fokusira na poboljšanu podršku za više grafičkih procesora (Multi-GPU) kroz poboljšanu kolektivnu komunikaciju i optimizovana radna opterećenja za više grafičkih procesora, otvarajući vrata skalabilnijim i energetski efikasnijim implementacijama vještačke inteligencije.
Ovo je posebno korisno za radna opterećenja koja zahtijevaju distribuisano računanje na više grafičkih procesora (GPU), smanjujući uska grla i poboljšavajući ukupni protok.
Red Hat AI Inference Server, distribucija vLLM-a za preduzeća, podržavat će AMD Instinct grafičke procesore odmah po instalaciji. Kao vodeći komercijalni doprinositelj vLLM-u, Red Hat osigurava kompatibilnost prilikom implementacije vLLM-a na različitim hardverskim opcijama, uključujući AMD Instinct grafičke procesore.
Modernizacija podatkovnog centra
Pored ubrzanja vještačke inteligencije, partnerstvo se bavi modernizacijom podatkovnih centara putem Red Hat OpenShift Virtualization, validirane za AMD EPYC procesore.
Ova integracija pomaže preduzećima da optimizuju implementaciju aplikacija na vodećim serverskim platformama, a istovremeno održavaju most ka budućnosti zasnovanoj na cloudu.
Red Hat OpenShift virtualizacija na AMD EPYC procesorima omogućava visoke stope konsolidacije infrastrukture, što potencijalno dovodi do značajno nižih ukupnih troškova vlasništva u svim dimenzijama hardvera, licenciranja softvera i potrošnje energije.
Ovaj strateški pristup omogućava IT timovima da upravljaju kritičnim opterećenjima, a istovremeno oslobađaju resurse za opterećenja vještačke inteligencije.
Saradnja pokazuje posvećenost obje kompanije proširenju izbora za korisnike u izgradnji, implementaciji i upravljanju AI radnim opterećenjima u hibridnim cloud okruženjima, što u konačnici demokratizuje pristup naprednim AI tehnologijama za preduzeća svih veličina.
Izvor: CyberSecurityNews