
Nvidia Rubin Ultra : le premier GPU IA avec 1 To de mémoire
Nvidia dévoile le Rubin Ultra, premier GPU IA avec 1 To de HBM4E. Intégré au rack Kyber NVL144, il promet 4x les performances actuelles. Arrivée en 2027.
Nvidia dévoile une puce d'intelligence artificielle avec autant de mémoire qu'un disque dur
Nvidia vient de montrer le Rubin Ultra au monde entier, et les chiffres donnent le vertige. On parle d'un processeur graphique (GPU, la puce spécialisée qui fait tourner l'intelligence artificielle) équipé de 1 téraoctet de mémoire. Un téraoctet, c'est 1 000 gigaoctets, soit autant que le disque dur de beaucoup d'ordinateurs. Sauf qu'ici, c'est de la mémoire ultra-rapide, intégrée directement sur une seule puce. C'est une première dans l'industrie.
Pour comprendre à quel point c'est beaucoup : imaginez que la mémoire d'un GPU classique, c'est un petit bureau de travail. Vous pouvez y poser quelques dossiers. Le Rubin Ultra, c'est une table de conférence entière. Vous pouvez y étaler tous vos dossiers en même temps et travailler sur tout sans jamais avoir à les ranger pour en sortir d'autres.
Un nouveau système de rangement pour les centres de données
Avec le Rubin Ultra, Nvidia ne se contente pas de sortir une puce plus puissante. L'entreprise repense toute l'armoire informatique (appelée "rack") avec un nouveau design nommé Kyber. Au lieu des plateaux horizontaux classiques, Kyber utilise des plateaux verticaux et intègre un refroidissement par liquide par défaut (comme un système de chauffage central, mais en version refroidissement pour les puces).
Le résultat ? 144 puces dans une seule armoire. C'est le double de la génération précédente qui en contenait 72. Et comme chaque puce est aussi deux fois plus puissante, Nvidia annonce des performances au moins quatre fois supérieures. Quatre fois plus de puissance dans le même espace physique.
Pourquoi c'est important pour l'intelligence artificielle
Un téraoctet de mémoire sur un seul GPU, ça ouvre des possibilités qui n'existaient pas avant. Les modèles d'intelligence artificielle les plus massifs (pensez à ChatGPT ou Claude, mais en beaucoup plus gros) ont besoin de répartir leur "cerveau" sur des dizaines de puces aujourd'hui. Avec le Rubin Ultra, ces mêmes modèles pourraient tenir sur beaucoup moins de puces.
Moins de puces impliquées, c'est moins de communication entre elles (comme si au lieu de faire circuler des dossiers entre dix bureaux, tout le monde travaillait dans la même pièce), moins de temps perdu en transit, et des réponses plus rapides.
Pour l'entraînement des modèles aussi (la phase d'apprentissage où on "enseigne" au programme en lui montrant des milliards d'exemples), plus de mémoire par puce signifie qu'on peut traiter des lots plus gros en une seule fois. C'est comme cuisiner un gâteau entier au lieu de le faire tranche par tranche.
Une question d'économies aussi
Une armoire Kyber qui offre quatre fois les performances de la génération précédente, c'est potentiellement quatre fois moins d'armoires nécessaires pour la même charge de travail. Moins d'espace occupé, moins de refroidissement nécessaire, moins d'infrastructure réseau. Pour les entreprises qui dépensent des millions en centres de données, l'équation économique est séduisante.
Un design presque sans câbles
Les plateaux du Rubin Ultra sont quasiment dépourvus de câbles. C'est un détail qui en dit long sur la direction que prend Nvidia. L'entreprise ne vend plus simplement des puces. Elle vend des systèmes complets, du composant à l'armoire, en passant par le réseau et le refroidissement.
Pour les clients finaux, les gros exploitants de centres de données et les laboratoires de recherche, c'est la promesse d'une installation plus propre et de déploiements plus rapides. Un peu comme acheter une cuisine équipée plutôt que chaque meuble séparément.
Disponible en 2027
Le Rubin Ultra est annoncé pour 2027. Pas de date précise, mais c'est suffisamment proche pour que les gros clients commencent déjà à planifier leurs commandes. Nvidia ne ralentit pas le rythme : avant même que la génération actuelle soit pleinement déployée, l'entreprise montre déjà la suivante. L'intention est claire : rester loin devant la concurrence.
Crédit image : Nvidia
À lire aussi
GIGABYTE dévoile ses serveurs NVIDIA Rubin au GTC 2026
La filiale data center de GIGABYTE frappe fort au GTC 2026 avec des serveurs Vera Rubin, un supercalculateur de bureau et une usine IA à Taïwan.
Nvidia abandonne le Rubin CPX au profit du Groq 3 LPU
Au GTC 2026, Nvidia enterre discretement le Rubin CPX et mise tout sur le Groq 3 LPU, un processeur d'inference SRAM qui redefinit le decode IA.