Din 2024 încoace, placa grafică a depășit definitiv statutul de componentă de gaming. GPU-ul a devenit infrastructura critică pe care rulează inteligența artificială globală — de la chatboți și generatoare de imagini la modele de limbaj masive și sisteme autonome. Iar în ultimele 12 luni, trei producători au transformat piața simultan: NVIDIA a lansat cea mai importantă arhitectură din ultimul deceniu, AMD a revenit cu un competitor real la preț corect, iar Intel a livrat cea mai bună surpriză sub 300 de dolari din istoria recentă a GPU-urilor.
Intel Arc Battlemage — Surpriza Lui Decembrie 2024
Pe 12 decembrie 2024, Intel lansează Arc B580 și îngheață piața. Prețul: 249 de dolari. Memoria: 12 GB GDDR6. Performanța: egală sau superioară față de RTX 4060 (299 dolari) și RX 7600 XT (329 dolari) în rasterizare pură.
Battlemage corectase problemele fundamentale ale lui Alchemist. Driverele erau stabile, performanța în DirectX 11/DX9 nu mai era dezastruoasă, iar XeSS 2 aducea atât AI upscaling cât și Frame Generation — generare de cadre intermediare prin AI, funcție pe care altfel o găseai doar la NVIDIA RTX.
Arc B580 a devenit instantaneu cel mai bun GPU sub 300 de dolari din istoria recentă. O demonstrație că Intel poate concura serios pe segment mid-range — dacă investește resursele necesare în software și drivere. Arc B570 (219 dolari, 10 GB GDDR6) a urmat în ianuarie 2025, extins segmentul buget. Intel joacă lung — și pentru prima dată pare credibil.
NVIDIA Blackwell — RTX 50 Series și Cel Mai Mare Salt din Ultimii 10 Ani
La CES 2025 pe 6 ianuarie, Jensen Huang apare pe scenă cu un laptop în mână și anunță familia GeForce RTX 50 bazată pe arhitectura Blackwell. Iată ce înseamnă față de Ada Lovelace (generația anterioară):
- RTX 5090 — 21.760 CUDA cores (față de 16.384 la RTX 4090), 32 GB GDDR7 pe magistrală de 512-bit, TDP 575W. Preț: $1.999. Performanță rasterizare: +30% față de 4090. Dar cu DLSS 4 Multi Frame Generation activat, creșterile efective în jocuri pot atinge 200–300%.
- RTX 5080 — 10.752 CUDA cores, 16 GB GDDR7, 360W, $999. Performanță similară sau superioară RTX 4090 în multe titluri.
- RTX 5070 Ti — 8.960 CUDA cores, 16 GB GDDR7, 300W, $749. A câștigat titlul de cel mai bun raport performanță/preț din segmentul premium.
- RTX 5070 — 6.144 CUDA cores, 12 GB GDDR7, 250W, $549.
- RTX 5060 Ti — anunțat ulterior, 16 GB (varianta premium) / 8 GB, $379 / $299. Controversa: varianta 8 GB este insuficientă pentru unele jocuri la 1440p.
Arhitectura Blackwell folosește procesul de fabricație TSMC 4N (similar cu Ada Lovelace, dar optimizat), cu Tensor Cores de generația a 5-a și RT Cores de generația a 4-a. Principalul salt nu este la hardware brut — este la software: DLSS 4.
DLSS 4 cu Multi Frame Generation — Redefinirea Performanței
DLSS (Deep Learning Super Sampling) a trecut prin 4 generații: upscaling simplu, upscaling AI cu calitate bună, calitate excelentă, și acum — Multi Frame Generation. Principiul: GPU-ul randează 1 cadru real, iar AI-ul generează 3 cadre intermediare — rezultând 4 cadre pe ecran din munca unui singur cadru randat. Practic, 4× framerate față de ce ar produce GPU-ul singur.
Exemplu concret: un RTX 5080 care randează nativ 60 fps afișează prin DLSS 4 MFG aproximativ 240 fps. Cu upscaling DLSS activat (DLSS 4 folosește un model Transformer nou, cu calitate superioară față de DLSS 3), poate ajunge la 300+ fps.
Criticii ridică o întrebare legitimă: cadrele generate AI introduc latență de intrare (input lag), deoarece cadrele intermediare nu reflectă starea reală a jocului în momentul afișării. NVIDIA a răspuns cu NVIDIA Reflex 2 — tehnologie care reduce latența de input independent de framerate, compensând efectul MFG. Rezultatul practic: în titluri competitive (shootere, racing), latența efectivă rămâne acceptabilă; în single-player, diferența este neglijabilă vizual.
DLSS 4 Transformer (modelul de upscaling, separat de MFG) este disponibil și pe RTX 20/30/40 printr-un driver update — NVIDIA a retroportat îmbunătățirea de calitate a imaginii pe toate cardurile recente, nu doar pe RTX 50. Un gest strategic care menține loialitatea bazei largi de utilizatori RTX.
AMD RDNA4 — Revenirea cu FSR 4
Pe 12 martie 2025, AMD lansează familia Radeon RX 9000 bazată pe arhitectura RDNA4 — și surprinde din nou piața cu raportul preț/performanță.
RX 9070 XT: 4.096 shadere, 16 GB GDDR6, TDP 220W, preț $599. Performanță rasterizare egală sau ușor superioară RTX 5070 Ti ($749) în multe titluri. Diferența: NVIDIA câștigă clar când DLSS 4 MFG este activat, dar AMD câștigă clar la prețul brut. RX 9070: 3.584 shadere, 16 GB GDDR6, TDP 220W, $549 — rivalul direct al RTX 5070.
Arhitectura RDNA4 (Navi 48) este fabricată pe TSMC N4P, cu îmbunătățiri masive față de RDNA3: ray tracing hardware de 2× mai rapid, shader arrays optimizate, eficiență energetică semnificativ îmbunătățită. AMD a ascultat critica principală la adresa RDNA3 — ray tracing slab — și a rezolvat-o.
Marea carte AMD: FSR 4 (FidelityFX Super Resolution 4). Spre deosebire de FSR 3 (algoritmic, fără AI), FSR 4 folosește Machine Learning — o rețea neuronală antrenată similar cu DLSS. Calitatea se apropie de DLSS 4 Transformer în multe scenarii. Și ca întotdeauna cu FSR: funcționează pe orice GPU, inclusiv NVIDIA și Intel Arc (față de DLSS care rămâne exclusiv NVIDIA). AMD joacă ecosistem deschis — o strategie care câștigă simpatia developerilor și a utilizatorilor pe alte platforme.
Criza VRAM — Memoria Video Devine Dealbreaker
Un subiect fierbinte în 2024–2025: cantitatea de VRAM a GPU-urilor mid-range este insuficientă pentru jocurile moderne la rezoluții înalte. Titluri AAA recente precum Alan Wake 2, Cyberpunk 2077 Phantom Liberty și Indiana Jones and the Great Circle consumă 10–12 GB VRAM la setări ultra 4K.
AMD a înțeles mesajul: 16 GB GDDR6 standard pe tot gama RX 9070/9070 XT. NVIDIA a răspuns parțial — RTX 5070 și 5070 Ti au 16 GB, dar RTX 5060 Ti cu 8 GB rămâne o alegere controversată în 2025. Tendința clară: 16 GB devine noul minim pentru orice GPU serios. Jocurile cu AI generativ, texturi upscalate on-the-fly și ray tracing complet vor împinge pragul spre 24 GB în câțiva ani.
GPU-ul Depășește Gaming-ul — Era AI Datacenter
Dacă RTX 50 series reprezintă evoluția GPU-urilor de consum, Blackwell datacenter este o altă lume. NVIDIA H200 (produs masiv din 2024): GPU Hopper cu 141 GB HBM3e și bandwidth de 4,8 TB/s. La 989 TFLOPS FP16, H200 este folosit pentru inferență de modele masive — ChatGPT, Claude, Gemini rulează fizic pe servere cu H100/H200.
NVIDIA B200 (Blackwell datacenter, 2025): 192 GB HBM3e, 20 PETAFLOPS FP4 per GPU. La FP4 (precizie redusă, suficientă pentru inferență AI), capacitatea de calcul a explodat față de generațiile anterioare.
Dar cu adevărat revoluționar este GB200 NVL72 — un rack complet cu 72 de GPU-uri B200 interconectate prin NVLink la 1,8 TB/s bandwidth intern:
- 1,4 ExaFLOPS FP4 per rack
- 13,5 TB memorie HBM3e agregată
- Consum ~120 kW de electricitate per rack (răcire lichidă obligatorie)
- Prețul estimat al unui sistem NVL72: 3–4 milioane de dolari
Microsoft, Google, Meta, Amazon și Oracle au comandat mii de astfel de sisteme. NVIDIA a primit comenzi pentru GB200 evaluate la zeci de miliarde de dolari înainte de livrarea primelor unități.
AMD concurează cu Instinct MI325X: 288 GB HBM3e (mai mult decât B200!), 1,3 PFLOPS BF16. AMD câștigă la memorie și este semnificativ mai accesibil ca preț — principalul motiv pentru care Meta și Microsoft au diversificat comenzile spre AMD. Google TPU v5p continuă să alimenteze infrastructura proprie (Search, Gemini, YouTube). Apple și-a construit propriul Neural Engine integrat în seria M, dar nu produce cipuri AI de datacenter pentru terți.
Ce Urmează — Tendințele Pentru 2025–2030
Câteva direcții clare pentru anii următori:
- Arhitecturi chiplet pentru GPU — AMD lucrează la RDNA5 cu design chiplet (mai mulți die mici interconectați, similar cu Ryzen). Avantaj: randament mai bun la fabricație, cost mai mic. NVIDIA explorează soluții avansate de packaging 3D CoWoS pentru GPU-urile datacenter.
- AI upscaling omniprezent — DLSS 4, FSR 4, XeSS 2 vor deveni standard în toate jocurile AAA. Randarea nativă la 4K va dispărea practic din titluri performante — AI va genera imagini 4K din 1080p randat cu calitate vizuală aproape identică.
- Grafica integrată mai puternică — AMD Strix Halo (Radeon 890M integrat) oferă performanță echivalentă cu un GPU dedicat mid-range din 2022, fără GPU extern. Qualcomm Snapdragon X Elite merge în aceeași direcție. Laptopurile thin and light vor elimina nevoia GPU dedicat pentru mulți utilizatori.
- Memoria HBM accesibilă — GPU-urile datacenter au desfășurat HBM stacked 3D. Versiunile viitoare vor atinge 300–400 GB per GPU, eliminând principala limitare în antrenarea modelelor AI mari.
- GPU vs. ASIC pentru AI — GPU-urile sunt flexibile dar nu optime pentru inferență pură. Cipuri dedicate (Groq, Cerebras, Etched) atacă GPU-ul în nișa inferenței rapide. Totuși, NVIDIA controlează ecosistemul CUDA prea bine — migrarea la alternative este lentă și costisitoare.
Concluzie — GPU-ul ca Infrastructură a Civilizației Digitale
Am parcurs în aceste 4 episoade un drum de 43 de ani: de la MDA cu text alb pe negru (1981), prin Voodoo 1 care a lansat 3D-ul accesibil (1996), prin GeForce 8800 GTX care a inventat GPGPU (2006), și ajungând azi la o realitate pe care nimeni nu o anticipa la început: GPU-ul nu mai este o componentă de gaming — este infrastructura pe care rulează inteligența artificială globală.
ChatGPT, Claude, Gemini, Midjourney, Sora — toate există fizic pe servere NVIDIA. Fiecare întrebare trimisă unui chatbot AI consumă fracțiuni de secundă de calcul pe un GPU Blackwell sau Hopper, undeva într-un datacenter răcit cu apă, consumând kilowați de energie electrică. Fiecare imagine generată prin AI a trecut prin miliarde de operații matriciale pe Tensor Cores.
NVIDIA a prezis această tranziție acum aproape 20 de ani când a creat CUDA. AMD a rămas competitiv pe gaming și a început să câștige teren pe AI. Intel a revenit cu o ofertă credibilă. Și GPU-ul — chip inventat să miște poligoane în jocuri pe calculator — a ajuns să antreneze modelele care vor redefini modul în care lucrăm, creăm și gândim.
Seria despre Istoria Plăcilor Video se încheie aici — dar istoria GPU-urilor abia a început să devină cu adevărat interesantă.
Fii primul care comentează acest articol!