Intelligence ArtificielleactualitesPublié le 16 mars 2026 à 23:44• 3 min de lecture

NVIDIA Vera Rubin : la puce IA la plus puissante jamais conçue

NVIDIA dévoile Vera Rubin au GTC 2026 : 336 milliards de transistors, 288 Go HBM4, 50 PFLOPS par GPU. L'architecture qui va dominer l'IA en 2027.

# NVIDIA Vera Rubin : la puce IA la plus puissante jamais conçue

Jensen Huang ne fait jamais les choses à moitié. Lors de sa keynote au GTC 2026 ce lundi 16 mars, le patron de NVIDIA a levé le voile sur Vera Rubin, la prochaine architecture GPU qui promet de bouleverser le monde de l'intelligence artificielle.

Et le moins qu'on puisse dire, c'est que les chiffres donnent le vertige.

Le GPU NVIDIA Rubin avec ses 50 PFLOPS d'inférence et 22 To/s de bande passante mémoire

Crédit : NVIDIA Corporation

336 milliards de transistors dans un seul GPU

La puce Vera Rubin repose sur le procédé 3 nm de TSMC et adopte un design dual-die, avec deux chiplets de calcul qui cumulent 336 milliards de transistors. Pour mettre ça en perspective, c'est 1,6 fois plus que l'architecture Blackwell et ses 208 milliards de transistors.

Chaque GPU Rubin embarque 288 Go de mémoire HBM4 avec une bande passante record de 22 To/s. En termes de performances brutes, on parle de 50 PFLOPS d'inférence en NVFP4 par puce, soit cinq fois plus que le GB200 Blackwell. NVIDIA ne se contente pas d'itérer, la marque fait un bond en avant.

Le CPU Vera : 88 cœurs Arm pour orchestrer la bête

Côté processeur, NVIDIA a conçu le CPU Vera (nom de code Olympus), basé sur l'architecture Arm v9.2-A. Avec 88 cœurs maison, jusqu'à 1,2 To/s de bande passante mémoire LPDDR5X et le Scalable Coherency Fabric de NVIDIA, ce processeur est taillé pour les charges de travail les plus gourmandes en données.

Fini le Grace CPU, place à Vera. L'idée reste la même — un CPU optimisé pour fonctionner main dans la main avec le GPU — mais à une échelle qui n'a plus rien à voir.

NVL72 : un rack complet pour 3,6 EFLOPS

Le format de déploiement de référence s'appelle NVL72. Il regroupe 72 GPU Rubin et 36 CPU Vera dans un seul rack refroidi par liquide. Les chiffres sont hallucinants : 3,6 exaFLOPS en inférence FP4, 20,7 To de mémoire HBM4 et 260 To/s de bande passante NVLink 6.

Pour les hyperscalers qui déploient des modèles massifs, c'est un changement de paradigme. Un seul rack NVL72 Vera Rubin dépasse ce que des clusters entiers de H100 pouvaient offrir il y a deux ans.

Sept puces, cinq systèmes, un supercalculateur

Vera Rubin ne se résume pas à un GPU. C'est une plateforme de calcul complète comprenant sept puces, cinq systèmes rack-scale et un supercalculateur, le tout conçu pour l'IA agentique. Jensen Huang l'a présenté comme la réponse à la prochaine phase de l'IA, celle où l'inférence et les agents autonomes prendront le relais de l'entraînement massif.

NVIDIA a aussi intégré le BlueField-4 STX pour l'architecture de stockage, un composant essentiel pour alimenter ces monstres de calcul en données sans créer de goulots d'étranglement.

Quand pourra-t-on en profiter ?

Les premiers échantillons Vera Rubin seront expédiés aux fournisseurs cloud de premier rang fin 2026, avec une production à grande échelle prévue début 2027. AWS, Microsoft Azure et Google Cloud sont déjà confirmés comme partenaires de déploiement.

Microsoft a notamment annoncé le support des systèmes NVL72 Vera Rubin sur Azure, tandis qu'AWS déploie déjà plus d'un million de GPU NVIDIA dans ses centres de données.

Avec Vera Rubin, NVIDIA pose les bases d'une ère où l'inférence IA à grande échelle devient la norme. Jensen Huang a d'ailleurs estimé que les commandes combinées entre Blackwell et Vera Rubin atteindraient 1 000 milliards de dollars d'ici 2027.

La course à la puissance IA n'est pas près de ralentir.

Source : [NVIDIA Newsroom](https://nvidianews.nvidia.com/) — [NVIDIA GTC 2026 Blog](https://blogs.nvidia.com/blog/gtc-2026-news/)

NVIDIA Vera Rubin : la puce IA la plus puissante jamais conçue

336 milliards de transistors dans un seul GPU

Le CPU Vera : 88 cœurs Arm pour orchestrer la bête

NVL72 : un rack complet pour 3,6 EFLOPS

Sept puces, cinq systèmes, un supercalculateur

Quand pourra-t-on en profiter ?

À lire aussi

Mistral Small 4 : un seul modèle pour tout faire

NVIDIA IGX Thor : l'IA industrielle passe en production

Nemotron Coalition : les 6 familles de modèles IA de NVIDIA