A télécharger
Spécial Teratec – HPC
nVidia lance une nouvelle architecture GPU baptisée Kepler
Stéphane QUENTIN – Responsable communication nVidia
Christian GLADIEUX – Rédacteur en Chef – Cad Magazine :
Stéphane QUENTIN, bonjour. Vous êtes responsable de la communication pour la société nVidia, nVidia qui lance une nouveauté depuis quelques semaines ; Kepler. Qu’est-ce qu’il y a derrière ce nom ?
Stéphane QUENTIN – Responsable communication – nVidia :
Kepler, c’est le nom de la nouvelle architecture de nos GPU qui vient d’être annoncé, qui a été annoncé en février d’abord dans le domaine du jeu vidéo qu’on appelle Legiforce. On a montré à ISC il y a maintenant une semaine la première démonstration de la carte Kepler pour les supercalculateurs qu’on appelle la Tesla K10. L’intérêt de cette architecture Kepler, c’est qu’aujourd’hui elle permet d’avoir un bénéfice d’utilisation qui est d’à peu près trois fois en performance par watt par rapport à l’ancienne architecture Fermi. Et aujourd’hui, la carte K10 à base de processeurs Kepler est la première carte qui offre une densité de calcul trois fois supérieure à Fermi.
Christian GLADIEUX :
Donc, c’est un GPU, c’est une carte GPU qui est utilisée pour faire du calcul haute performance. À qui s’adresse-t-elle ? Est-ce que ce sont des grandes entreprises qui peuvent se payer cela, ou est-ce qu’on peut aussi aborder des PME avec votre produit ?
Stéphane QUENTIN :
Chez nVidia, on a différents cycles, différents types de distribution, donc on va être sur le supercalcul avec des partenaires comme Bull, avec des calculs très spécifiques sur du supercalculateur, donc avec des machines qui vont intégrer 2.000, 3.000, 5.000, 6.000 GPU Kepler, jusqu’à l’utilisateur particulier, donc à l’artisan, à l’étudiant qui va avoir besoin d’une puissance de calcul suffisante pour faire de la modélisation en 3D, pour faire du rendu vidéo, pour faire de la simulation E. Et là, on va arriver sur des stations de travail qu’on va trouver sous le bureau, et donc on a vraiment quelque chose d’extrêmement large comme type de clients. Du supercalculateur au calculateur personnel, on a toutes les offres qui sont adressées via différents partenaires, que ce soit l’intégrateur classique jusqu’à l’OIM, jusqu’à l’ISV et ainsi que l’assisté spécialisé.
Christian GLADIEUX :
Vous avez dit tout à l’heure que cette carte permettait finalement d’adresser un grand nombre d’applications, du rendu réaliste au calcul de structure. Est-ce que vous avez des exemples, des applications types, ou justement ces performances sont évidentes ? Est-ce qu’on peut citer un cas client par exemple ?
Stéphane QUENTIN :
Aujourd’hui, on a pris depuis 5 ans qu’on a introduit le Cuda et donc l’architecture de calcul GPU. On a à peu près 200 applications dans tous les secteurs qui sont optimisés pour le calcul sur GPU. Ça va du rendu par exemple vidéo sur After Effect ou sur Adobe CS6 à la mécanique des fluides avec des librairies comme Ansys, au calcul financier avec des librairies spécifiques sur l’algorithme de Monté Carlo, à l’intégration dans Matlab. Donc aujourd’hui, on a un schéma de logiciels qui est vraiment très très large, donc quasiment tous les secteurs d’activités qui ont besoin de puissance de calcul sont directement impliqués, même par exemple du rendu retrecing, si on regarde historiquement d’où vient nVidia aujourd’hui, on n’utilise plus des cartes graphiques pour faire du retrecing, on utilise des cartes Tesla qui font du calcul pur sur le retrecing. Donc aujourd’hui, on a quasiment toutes les librairies qui sont potentiellement accélérables parce que parallèles, le sont aujourd’hui via les cartes Tesla et Cuda.
Christian GLADIEUX :
Oui, mais côté éditeurs ? Est-ce que les éditeurs aujourd’hui sont tous à-même de fournir des outils de calcul ou de simulation qui utilisent ce type de technologie, et donc est-ce qu’ils ont dû réécrire par exemple leur code de calcul ?
Stéphane QUENTIN :
Ça a été un des premiers points sur lequel nVidia a travaillé depuis 5 ans. Ça a été déjà l’éducation, ça a été la recherche universitaire, ça a été déjà de recontacter tous les ISV où on avait détecté une potentialité sur le GPU Computing de travailler directement avec eux pour que les librairies justement soient facilement portables sur l’architecture GPU. Récemment, on a lancé une initiative qui s’appelle Open ACC qui permet via des directives de simplifier, de montrer le potentiel de votre code très rapidement, s’il va être rapidement exploitable sur GPU, de l’ordre par exemple 4 fois en une demi-journée, avec des partenaires comme Caps, on peut très bien montrer qu’un code va pouvoir bénéficier d’une architecture GPU. Donc aujourd’hui, on est vraiment, avec le GPU, dans la démocratisation large ; le code est là, les outils sont là pour vraiment optimiser le code, les produits sont là, la performance par watt est là, et on est vraiment dans l’univers du calcul parallèle très bien implanté, et c’est beaucoup plus simple que ne serait-ce il y a un an ou deux ans.
Christian GLADIEUX :
Ce type de carte rentre uniquement dans une station de travail, ou on peut également en voir dans des serveurs LAM ?
Stéphane QUENTIN :
On a des différents Form Factor sur les cartes K10, on va les trouver sous des stations de travail, avec des systèmes de ventilation. La carte qu’on a là, c’est d’ailleurs la carte qui va dans un serveur LAM puisqu’elle n’a aucun ventilateur dessus puisque les ventilateurs sont frontaux sur le LAM.
Christian GLADIEUX :
Leur propre ventilateur.
Stéphane QUENTIN :
Donc, le flux d’air circule le long de cette carte, donc ces différents Form Factor sont disponibles. On a même certains OIM et intégrateurs qui ont des designs spécifiques pour les K10 qui intègrent directement leur système.
Christian GLADIEUX :
Donc c’est la nouveauté aujourd’hui nVidia pour le calcul numérique haute performance. Quelle est l’étape suivante ?
Stéphane QUENTIN :
On a annoncé deux choses récemment ; la K10 qui est disponible aujourd’hui, K20 qui va sûrement arriver vers la fin de l’année, qui est une architecture encore plus complexe, qui introduit deux types de fonctionnalités qu’on appelle Ipercu et le parallélisme dynamique qui sont des fonctionnalités qui sont prises en charge par Cuda 5.0, qui vont encore faciliter le travail des développeurs puisque là les GPU vont pouvoir communiquer entre eux via le réseau, directement, sans passer par le CPU, donc ce qu’on appelle GPU direct. Donc à la fin de l’année, on aura effectivement une puissance de calcul qui va être encore multipliée par un facteur X, et une facilité de programmation des GPU encore simplifiée, donc un gain de performance par watt énorme. Et puis nVidia récemment s’est engagé effectivement sur des supercalculateurs à base d’architecture Arm, Arm + Cuda, qui est une voie extrêmement enrichissante dans le domaine de la performance par watt puisque quand on a une architecture massivement parallèle, le GPU est là et le calcul serial n’est pas vraiment très important.
Christian GLADIEUX :
Est-ce que c’est transparent pour l’utilisateur ? Est-ce que l’ingénieur qui se trouve dans son bureau d’études, qui doit lancer un calcul de fluides ou un calcul de structure, est-ce qu’il a quelque chose à faire ou doit-il s’occuper de quelque chose lorsqu’il a une carte Kepler dans sa machine ?
Stéphane QUENTIN :
C’est très simple, si sa librairie a été optimisée – je citais l’exemple tout à l’heure de la librairie largement utilisée par le calcul de manufacturing et de simulation – si sa librairie a déjà été optimisée pour le GPU, il n’aura rien à faire.
Christian GLADIEUX :
C’est transparent ?
Stéphane QUENTIN :
C’est transparent. Les cartes sont vues, les drivers sont installés, le système le reconnait et c’est transparent, ça va être fait directement, et il aura un bénéfice utilisateur instantané puisque s’il fait de la visualisation en général dans ce cas spécifique, il aura une carte Quadro pour la visualisation et les cartes Tesla pour le calcul, il aura le bénéfice directement.
Christian GLADIEUX :
Dernière chose, est-ce qu’on peut avoir une idée du prix d’entrée de ce type de carte ?
Stéphane QUENTIN :
Le K10 aujourd’hui a un prix d’entrée d’environ 2.000 euros HT, qui fait que par rapport à la performance par watt, ça en fait le produit qui a le meilleur ratio performance/prix par watt du marché.
Christian GLADIEUX :
Donc, ça peut tout à fait rentrer dans le budget d’une PME pour équiper des stations de travail qu’elle utilisait pour du calcul numérique jusque-là ?
Stéphane QUENTIN :
Effectivement, il y a des machines aujourd’hui qui sont faites par des intégrateurs ou par HP ou Dell qui intègrent directement les cartes Tesla, et on multiplie cette puissance, on peut mettre jusqu’à 4 cartes Tesla K10 dans une machine, on a à disposition 8 GPU, et là on a atteint une performance extrêmement élevée pour un prix qui est somme toute dérisoire, on a son petit supercalculateur.
Christian GLADIEUX :
Stéphane QUENTIN, merci, et puis j’espère qu’on se reverra sans doute sur Manufacturing.fr pour la prochaine version de cet accélérateur graphique. Merci.
Stéphane QUENTIN :
Avec plaisir, merci beaucoup.