
NVIDIA Vera Rubin : la puce IA la plus puissante jamais conçue
NVIDIA dévoile Vera Rubin au GTC 2026 : 336 milliards de transistors, 288 Go HBM4, 50 PFLOPS par GPU. L'architecture qui va dominer l'IA en 2027.
# NVIDIA Vera Rubin : la puce IA la plus puissante jamais conçue
Jensen Huang ne fait jamais les choses à moitié. Lors de sa keynote au GTC 2026 ce lundi 16 mars, le patron de NVIDIA a levé le voile sur Vera Rubin, la prochaine architecture GPU qui promet de bouleverser le monde de l'intelligence artificielle.
Et le moins qu'on puisse dire, c'est que les chiffres donnent le vertige.

336 milliards de transistors dans un seul GPU
La puce Vera Rubin repose sur le procédé 3 nm de TSMC et adopte un design dual-die, avec deux chiplets de calcul qui cumulent 336 milliards de transistors. Pour mettre ça en perspective, c'est 1,6 fois plus que l'architecture Blackwell et ses 208 milliards de transistors.
Chaque GPU Rubin embarque 288 Go de mémoire HBM4 avec une bande passante record de 22 To/s. En termes de performances brutes, on parle de 50 PFLOPS d'inférence en NVFP4 par puce, soit cinq fois plus que le GB200 Blackwell. NVIDIA ne se contente pas d'itérer, la marque fait un bond en avant.
Le CPU Vera : 88 cœurs Arm pour orchestrer la bête
Côté processeur, NVIDIA a conçu le CPU Vera (nom de code Olympus), basé sur l'architecture Arm v9.2-A. Avec 88 cœurs maison, jusqu'à 1,2 To/s de bande passante mémoire LPDDR5X et le Scalable Coherency Fabric de NVIDIA, ce processeur est taillé pour les charges de travail les plus gourmandes en données.
Fini le Grace CPU, place à Vera. L'idée reste la même — un CPU optimisé pour fonctionner main dans la main avec le GPU — mais à une échelle qui n'a plus rien à voir.
NVL72 : un rack complet pour 3,6 EFLOPS
Le format de déploiement de référence s'appelle NVL72. Il regroupe 72 GPU Rubin et 36 CPU Vera dans un seul rack refroidi par liquide. Les chiffres sont hallucinants : 3,6 exaFLOPS en inférence FP4, 20,7 To de mémoire HBM4 et 260 To/s de bande passante NVLink 6.
Pour les hyperscalers qui déploient des modèles massifs, c'est un changement de paradigme. Un seul rack NVL72 Vera Rubin dépasse ce que des clusters entiers de H100 pouvaient offrir il y a deux ans.
Sept puces, cinq systèmes, un supercalculateur
Vera Rubin ne se résume pas à un GPU. C'est une plateforme de calcul complète comprenant sept puces, cinq systèmes rack-scale et un supercalculateur, le tout conçu pour l'IA agentique. Jensen Huang l'a présenté comme la réponse à la prochaine phase de l'IA, celle où l'inférence et les agents autonomes prendront le relais de l'entraînement massif.
NVIDIA a aussi intégré le BlueField-4 STX pour l'architecture de stockage, un composant essentiel pour alimenter ces monstres de calcul en données sans créer de goulots d'étranglement.
Quand pourra-t-on en profiter ?
Les premiers échantillons Vera Rubin seront expédiés aux fournisseurs cloud de premier rang fin 2026, avec une production à grande échelle prévue début 2027. AWS, Microsoft Azure et Google Cloud sont déjà confirmés comme partenaires de déploiement.
Microsoft a notamment annoncé le support des systèmes NVL72 Vera Rubin sur Azure, tandis qu'AWS déploie déjà plus d'un million de GPU NVIDIA dans ses centres de données.
Avec Vera Rubin, NVIDIA pose les bases d'une ère où l'inférence IA à grande échelle devient la norme. Jensen Huang a d'ailleurs estimé que les commandes combinées entre Blackwell et Vera Rubin atteindraient 1 000 milliards de dollars d'ici 2027.
La course à la puissance IA n'est pas près de ralentir.
À lire aussi
Mistral Small 4 : un seul modèle pour tout faire
Mistral lance Small 4, un modèle open-source de 119B paramètres qui unifie raisonnement, code et multimodal. Apache 2.0, 256K de contexte.
NVIDIA IGX Thor : l'IA industrielle passe en production
NVIDIA lance IGX Thor en disponibilité générale : IA temps réel pour l'industrie et la médecine, 8x plus rapide que son prédécesseur, avec 10 ans de support.
Nemotron Coalition : les 6 familles de modèles IA de NVIDIA
NVIDIA dévoile la Nemotron Coalition : six familles de modèles IA frontières couvrant le langage, la vision, la robotique, la conduite autonome, la biologie et le climat.