
Nvidia Rubin Ultra : le premier GPU IA avec 1 To de mémoire
Nvidia dévoile le Rubin Ultra, premier GPU IA avec 1 To de HBM4E. Intégré au rack Kyber NVL144, il promet 4x les performances actuelles. Arrivée en 2027.
Un téraoctet de mémoire sur un seul GPU
Nvidia vient de montrer le Rubin Ultra au monde entier, et les chiffres donnent le vertige. On parle d'un GPU IA équipé de 1 To de mémoire HBM4E. Un téraoctet. Sur une seule puce. C'est une première dans l'industrie, et ça repositionne complètement ce qu'on peut attendre d'un accélérateur d'intelligence artificielle.
Le Rubin Ultra embarque quatre chiplets de calcul dans un seul package. Nvidia a opté pour une nouvelle technologie d'empaquetage, même si les détails restent flous à ce stade. Le dissipateur thermique cache tout, et on ne sait même pas si le chip a déjà passé l'étape du tape-out. Ce qui frappe en revanche, c'est la taille relativement compacte du package. Ça laisse penser à un design empilé, mais c'est de la spéculation pour le moment.
Le rack Kyber change les règles du jeu
Avec le Rubin Ultra, Nvidia ne se contente pas de balancer un GPU surpuissant. L'entreprise repense toute l'architecture du rack avec Kyber, un nouveau design qui remplace les plateaux horizontaux par des plateaux verticaux et intègre le refroidissement liquide par défaut.
Le résultat ? 144 packages GPU dans un seul rack. C'est le double du Oberon NVL72 actuel qui en contient 72. Mais comme chaque package Rubin Ultra embarque aussi le double de tuiles GPU, Nvidia annonce des performances au moins quatre fois supérieures à la génération précédente. Quatre fois. Sur un seul rack.
Le plateau Rubin Ultra est quasi dépourvu de câbles. Ça simplifie l'assemblage, mais ça soulève une question qui ne va pas plaire à tout le monde : Nvidia pourrait vendre les plateaux complets directement, réduisant le rôle de ses partenaires à l'assemblage final des racks plutôt qu'à la conception de cartes mères et de plateaux serveurs. Un mouvement stratégique qui risque de faire grincer des dents dans l'écosystème.
NVLink 7e génération et réseau repensé
Côté interconnexion, le rack Kyber passe au switch NVLink de 7e génération. Le débit reste à 3600 Go/s, mais le nouveau switch permet de connecter davantage de GPU entre eux. C'est ce qui rend possible la configuration NVL144 avec ses 144 packages.
Nvidia introduit aussi le processeur Ethernet CX9-1600G pour accélérer les communications scale-out entre racks. Quand vous empilez autant de puissance de calcul dans un seul rack, le goulot d'étranglement se déplace vers le réseau. Le CX9 est la réponse de Nvidia à ce problème.
2027, c'est demain et c'est loin
Le Rubin Ultra est annoncé pour 2027. Pas de date précise, juste "sometime in 2027". C'est suffisamment loin pour que beaucoup de choses changent, mais suffisamment proche pour que les hyperscalers commencent déjà à planifier leurs commandes.
Ce qui est frappant avec cette démonstration, c'est à quel point Nvidia accélère le rythme. Les échantillons Vera Rubin (la version standard, avec 288 Go de HBM4 par GPU) sont déjà entre les mains des clients. Le NVL72 basé sur Rubin est prévu pour le second semestre 2026. Et avant même que cette génération ne soit déployée à grande échelle, Nvidia montre déjà la suivante.
C'est aussi un message clair envoyé à AMD et ses accélérateurs Instinct. Nvidia a récemment boosté les performances du Vera Rubin standard, en augmentant les fréquences boost et la bande passante mémoire, au prix de 500 watts supplémentaires qui poussent la consommation à 2300 watts. Le Rubin Ultra pousse cette logique encore plus loin.
Ce que ça change concrètement
Un téraoctet de HBM4E sur un seul GPU, ça ouvre des possibilités qui n'existaient tout simplement pas avant. Les modèles de langage les plus massifs, ceux qui nécessitent aujourd'hui de répartir leurs paramètres sur des dizaines de GPU, pourraient tenir sur un nombre bien plus réduit de Rubin Ultra. Moins de GPU impliqués, c'est moins de communication inter-GPU, moins de latence, et des inférences plus rapides.
Pour l'entraînement aussi, l'impact sera réel. Plus de mémoire par GPU signifie des batch sizes plus grands, ce qui accélère la convergence des modèles. Les chercheurs en IA qui se battent aujourd'hui avec les limites de mémoire vont apprécier.
Et puis il y a la question du coût total. Un rack Kyber NVL144 qui offre quatre fois les performances d'un NVL72, c'est potentiellement quatre fois moins de racks nécessaires pour une charge de travail donnée. Moins d'espace, moins de refroidissement, moins d'infrastructure réseau. Sur le papier, l'équation économique est séduisante.
Le plateau sans câbles, un détail qui en dit long
Revenons sur ce plateau quasi sans câbles. C'est un détail en apparence, mais il raconte beaucoup sur la direction que prend Nvidia. L'entreprise ne vend plus simplement des GPU. Elle vend des systèmes complets, du chiplet au rack, en passant par les switches réseau et le refroidissement.
Pour les OEM et les intégrateurs, ça peut être difficile à avaler. Leur marge de manœuvre se réduit quand Nvidia contrôle de plus en plus la chaîne. Mais pour les clients finaux, les hyperscalers et les labos de recherche, c'est la promesse d'une intégration plus propre et de déploiements plus rapides.
Nvidia a clairement l'intention de dominer le marché des accélérateurs IA pour encore un bon moment. Le Rubin Ultra et Kyber sont la preuve que l'entreprise ne compte pas lever le pied. Reste à voir si 2027 confirmera les promesses de cette démonstration.
Crédit image : Nvidia
À lire aussi
Sécurité IA : les CISO coincés avec les outils d'hier
67 % des CISO manquent de visibilité sur l'IA dans leur organisation. Le rapport Pentera 2026 révèle un décalage criant entre adoption et sécurisation.
Antec Flux Pro Noctua Edition : le silence premium
Antec et Noctua lancent le Flux Pro Noctua Edition avec ventilateurs G2 haut de gamme. Réduction de 8 dB(A), fan hub intégré et finitions marron signature. 399,90 €.
ASUS ROG Strix G16 et G18 2026 : Intel Ultra 9 et RTX 5080
ASUS devoile les ROG Strix G16 et G18 2026 avec Intel Core Ultra 9 290HX Plus et GPU RTX 5080. Mini LED, Tri-Fan et chassis sans vis au programme.