1. Domaines
  2. Matériel de CAO
  3. Station de travail Lenovo ThinkStation D30 dual Xeon, proce…

Station de travail Lenovo ThinkStation D30 dual Xeon, processeur graphique Quadro : quand de telles performances sont-elles nécessaires ?

Cette station de travail dual Xeon, la ThinkStation D30, la plus puissante et la plus évolutive ThinkStation de la gamme Lenovo, est conçue pour le design de haut vol, la simulation, la visualisation, et les activités multimédia. Dans quelle situation est-il nécessaire d'avoir autant de puissance et de capacités d'évolution ? CADplace passe en revue cette machine de guerre et vous donne quelques indications sur les cas nécessitant la puissance que cette ThinkStation met à votre disposition.

Think!

Le système testé est équipé de deux processeurs Intel Xeon E5 et de la nouvelle carte graphique professionnelle NVIDIA Quadro K5000. Le moniteur 30 pouces ThinkVision LT3053P professional complète parfaitement la ThinkStation D30. CADplace a réalisé des tests de performance des processeurs et de la carte graphique afin de voir à quel moment les processeurs couplés Xeon ainsi que les processeurs graphiques Quadro laissent exprimer leur puissance, mais également quand ils se font plus discrets.

Premières impressions : Lenovo a le souci du détail :

Lenovo a le sens du détail. Les clients apprécieront notamment les poignées de transport solides présentes sur ces stations de travail pesant près de 30kg. D'autres marques ont également ajouté de telles poignées, cependant sur la ThinkStation D30, les poignées sont accessibles dès l'ouverture du carton – détail pratique que nous ne retrouvons pas systématiquement chez la concurrence.

Le design industriel est moderne et reflète clairement deux décennies de philosophie propre à la marque, tournée vers la robustesse : du boîtier noir, solide, au toucher du clavier typique des ThinkStation. L'aération avant en nid d'abeilles permet de refroidir l'ensemble. Le système est tellement silencieux lorsqu'il tourne au ralenti que la seule manière de savoir qu'il est en fonctionnement est de mettre la main devant pour sentir le flux d'air.

L'écran ThinkVision LT3053P utilisé dans cette configuration est remarquable. Un accord parfait avec la D30, il est léger, plat, fin mais néanmoins gigantesque. La résolution de 2560x1600 sur un moniteur de 30 pouces est un plus non négligeable par rapport aux écrans HD d'une résolution de "seulement" 1920x1080, donnant aux designers le double d'espace afin d'augmenter la productivité (197.5% plus grand que la HD). Cerise sur le gâteau, cette très haute résolution convient parfaitement au Quadro K5000 du D30.

Evolutivité signifie faire les bons choix :

Si vous avez besoin d'une station de travail configurée avec double Xeon, Quadro ou Maximus, comme la ThinkStation D30, il est important de bien comprendre les exigences d'une telle configuration. Celle-ci dépend des applications que vous utilisez mais également – plus important encore – des ensembles de données que vous avez prévu d'utiliser tout au long de la vie de votre station de travail. Rappelez-vous : Ne configurez-pas votre station de travail en fonction de ce que vous allez faire aujourd'hui, configurez-la pour l'année prochaine. Préparez votre station de travail pour 12 à 18 mois plus tard.

La ThinkStation D30 peut être configurée au plus près de vos besoins : un ou deux processeurs Xeon ? Quelle vitesse d'horloge ? Processeur graphique Quadro de moyenne gamme ou très haut de gamme ? Configuration Maximus avec NVIDIA Tesla ? Disque SSD pour les applications et les données ? 64 ou 256 GB de mémoire ? Passons cette technologie en revue afin de déterminer l'équilibre idéal de cette configuration.

La technologie embarquée :

La productivité dépend de la performance, et les technologies du D30 tiennent leurs promesses. Nous avons affaire à une station de travail graphique, et Lenovo mis à niveau le processeur graphique, passant de l'architecture NVIDIA Fermi du Quadro 6000 à l'architecture NVIDIA Kepler du Quadro K5000. Pour simplifier, la nouvelle architecture de processeur graphique Kepler autorise de hautes performances, et cela avec une efficacité énergétique accrue.

En outre les deux processeurs Xeon sont basés sur la micro-architecture Sandy Bridge d'Intel. Le système testé était équipé de processeurs Intel Xeon E5-2906 cadencés à 2.4GHz. La ThinkStation D30 supporte toutes les options du processeur Xeon Sandy Bridge E5-2600, comme vous pourrez le constater en vous référant aux caractéristiques techniques de la ThinkStation.

L'architecture Sandy Bridge est également dotée de fonctions destinées à optimiser les performances du processeur. Intel Turbo Boost 2.0 et la technologie AVX améliorent les performances du processeur pour les applications techniques. Les processeurs Sandy Bridge sont dotés de connexions plus rapides vers la mémoire cache, d'une bande passante étendue vers la mémoire principale, d'une plus grande capacité de mémoire et d'interconnexions plus rapides entre les processeurs. L'architecture a donc été pensée pour diminuer le temps de latence, améliorer la bande passante, augmenter la capacité de mémoire et le transfert de données.

Le système de stockage de la ThinkStation D30 supporte aussi bien les disques durs de grande capacité que ceux misant sur la vitesse – disques durs allant jusqu'à 15,000 tours par minute, stockage SSD de 512 GB, ainsi que les disques durs d'une capacité de 2 TB. La connectivité n'a pas non plus été négligée. Douze ports USB sont disponibles, 2 à l'avant de la ThinkStation D30, et une option lecteur de cartes multi-format est proposée.

Le design, intérieur et extérieur :

Lenovo a fait du bon travail en dessinant la ThinkStation D30. Les poignées externes la rendent facile à déplacer si besoin. Les lecteurs optiques, le lecteur de cartes mémoire et deux ports USB se trouvent à l'avant du boîtier. A l'arrière se trouvent les ports USB restants, les ports destinés aux connexions réseau, les sorties d'affichage et l'alimentation.

Le boîtier de la ThinkStation D30 s'ouvre en actionnant un loquet sur le panneau latéral qui donne accès à l'intérieur du boîtier. Le loquet peut être verrouillé afin d'éviter que des personnels non qualifiés ou non autorisés n'y aient accès.

A l'intérieur du boîtier, l'air frais circule de manière fluide et silencieuse, avec une simple segmentation avant-arrière et haut-bas. De haut en bas nous trouvons : lecteurs optiques et alimentation, processeurs et mémoires, disques durs et carte graphique. La construction ouverte donne un accès aisé aux différents composants.

Test de la configuration :

La D30 est la station de travail la plus évolutive, et donc la plus performante de la famille Lenovo ThinkStation. Quand est-il nécessaire d'avoir autant de puissance et d'évolutivité ? La D30 étant équipée de deux processeurs Xeon et pouvant supporter plusieurs processeurs graphiques NVIDIA Quadro et Tesla, à quel moment l'accent doit-il être mis sur la puissance du processeur ou du processeur graphique ? Quelques tests ciblés peuvent nous mettre sur la voie.

CADplace  a utilisé le dispositif de contrôle des ressources système afin de suivre la charge des deux processeurs Xeon et chacun de leurs coeurs. Nous avons utilisé le programme de contrôle GPU-Z pour observer la charge de travail du processeur graphique Quadro K5000. Quelques tests de performance et mises en application nous donnent un bon aperçu de l'équilibre du système.

Les outils de synthèse de performance donnent une base à partir de laquelle travailler. Certains permettent une comparaison raisonnable de produits similaires. Nous avons utilisé l'outil de tests Viewperf 11 de Specbench.org afin d'établir le profil de performance graphique du système. Nous avons utilisé l'outil de tests Sandra de SISoftware pour les performances des processeurs.

L'utilisation d'Autodesk Showcase et 3ds Max nous permet d'observer les divers aspects de l'interaction et du rendu des modèles 3D. Interagir avec différentes tailles de modèles dans les deux programmes dresse le profil de la charge pesant sur les ressources système pour ceux-ci ainsi que d'autres programmes de dessin et modélisation 3D.

Puisqu'aujourd'hui tellement d'applications – de simulation, analyse financière et d'ingénierie, bio-sciences et rendu par lancer de rayon – utilisent les processeurs graphiques pour le calcul en plus de l'affichage graphique, les performances de calcul des processeurs graphiques sont importantes à analyser. CADplace a utilisé Adobe Premiere Pro CS 6 pour réaliser le profil de la charge de travail du processeur graphique.

Bien que le résultat final (la vidéo) soit "visuel", l'encodage vidéo est une application exigeant de la puissance de calcul et dépendant du processeur, de la même manière que les programmes de simulation CFD ou FEA exigent de la puissance de calcul et dépendent du processeur. Toutes ces disciplines tendent vers un environnement informatique hétérogène.

Test de performance :

Viewperf est basé sur une série de données issues de différentes applications de DAO 3D et de dessin. Les données ainsi que les modes de dessin cherchent à être représentatifs du domaine de dessin. Certains des tests Viewperf ont poussé le processeur graphique Quadro à 100% d'utilisation. Viewperf propose donc une comparaison pertinente des performances de la Quadro K5000 face à ces ainées. Voici les résultats obtenus avec la Quadro K5000 :

La comparaison avec le Quadro 6000, basé sur l'architecture graphique Fermi précédente, montre que le nouveau Quadro K5000 est constamment 30-35% plus rapide. Notamment, l'un des viewsets, lightwave 01, n'a pas demandé au processeur graphique plus de 15% de ses capacités.  Lorsque vous testez vos propres configurations, n'oubliez-pas que les tests relevant d'un traitement de données "léger", qui demande peu du processeur graphique, vont être moins représentatifs et seront probablement évalués en fonction des performances du processeur et non du processeur graphique.  L'entreprise specbench ayant récemment annoncé avoir prévu de faire une mise à jour de l'outil de test de performance viewperf, CADplace prendra la mesure de ses changements dès sa sortie.

Viewperf ne teste pas la performance multi-processus. Ceci n'est pas inhabituel pour une application de dessin 3D interactif, modélisation ou visualisation. Les performances sur Viewperf dépendent de la capacité de la station de travail à communiquer avec le processeur graphique, la charge du processeur portant essentiellement sur un coeur d'un seul processeur. C'est ce que nous verrons également avec Autodesk 3ds Max et Showcase.

Nous avons également eu recours aux tests de performance SISoftware Sandra pour processeur et processeur graphique. Bien que Viewperf s'apparente à un test essentiellement synthétique dans le sens où il s'efforce d'isoler le processeur graphique, vous pourrez constater que le processeur travaille à alimenter le processeur graphique et que le facteur limitant la performance est parfois le processeur et parfois le processeur graphique. Sandra est purement synthétique. Lorsque le test du processeur commence, tous les coeurs de celui-ci montent à 100% d'utilisation et le processeur graphique est au repos. Pour les tests du processeur graphique c'est l'inverse. Nous avons lancé les tests du logiciel Sandra pour vérifier ce fait en ayant recours à GPU-Z et au moniteur de ressources. Les résultats, en tant que données isolées, sont cependant inintéressants. Si vous évaluez différents systèmes, vous pouvez les comparer. Les résultats comparés entre différents systèmes ne devraient pas vous surprendre. Les processeurs et processeurs graphiques les plus rapides vont produire les meilleurs résultats.  CADplace considère que les tests de performance Sandra sont un bon test "raisonnable".

Test des applications :

3D Interactive :

La performance 3D Interactive n'est pas seulement une question de performance graphique.

CADplace a utilisé 3ds Max afin d'observer l'interaction avec un modèle 3D moyen et un autre de grande taille. Bien que nous ayons également fait du rendu basique, nous ne l'avons pas utilisé pour tester la performance de rendu ni la performance multi-processus (pour cela nous avons utilisé l'option lancer de rayon dans Showcase). Nous avons pris comme base un modèle de Ferrari afin de tester les performances interactives tout d'abord avec la version voiture unique puis avec la version 25 voitures.

Nous avons utilisé Autodesk Showcase pour tester le rendu interactif en temps réel et les programmes de lancer de rayon. Le premier fait travailler le processeur graphique, le second le processeur. Nous nous sommes assurés que les manipulations interactives du modèle en 3D ne charge qu'un ou deux coeurs du processeur, et s'intéresse plus spécifiquement au processeur graphique. Dans le mode lancer de rayon, Showcase n'utilise pas le processeur graphique pour générer l'image ainsi formée. Le processeur graphique n'était donc que peu chargé tandis que tous les coeurs du dual Xeon ThinkStation D30 tournaient à pleine capacité.

Cela montre également une différence de performance intéressante entre Showcase et 3ds Max dans leur faculté à interagir avec le modèle. Ni 3ds Max ni Showcase n'a eu de difficulté avec le modèle de Ferrari. Avec le modèle parking-CADplace-rempli-de-Ferraris (25 voitures), Showcase n'a pas démérité, avec une performance raisonnable de 3-4 images par seconde, tout en produisant des images de qualité. Showcase est fait pour fournir une visualisation interactive en temps réel et il remplit son contrat. 3Ds Max, en revanche, fait pour la modélisation 3D et l'animation, n'a pu manipuler les 25 Ferraris à une image toutes les quelques secondes, même en réduisant la qualité de l'image. La différence découle certainement du fait que ces programmes n'ont pas la même finalité. Bien qu'une petite différence ne soit pas inhabituelle, la question que l'on peut se poser est pourquoi les performances de ces deux applications Autodesk passent de raisonnable à inutilisable pour un même modèle.

Les données du moniteur de ressources ainsi que le programme de contrôle GPU-Z expliquent le problème du point de vue de la station de travail. Avec 3ds Max, la charge du processeur graphique varie entre 0% et 10-12%. Avec Showcase, la charge du processeur graphique varie entre 15% et 45%. Sous 3ds Max, le processeur graphique est presque au repos, et sous Showcase, il a une charge modérée et peut générer plus d'images par seconde. Dans les deux cas, le facteur limitant les performances se situe dans le système et non au niveau du Quadro K5000.

En utilisant le modèle de Ferrari unique, la fluidité se retrouve avec les deux programmes. En fait, nous pouvons constater qu'avec Showcase le processeur graphique est à pleine charge et génère plus de 75 images par seconde. La différence entre les facteur limitants de ces deux ensembles de données montrent comment le facteur limitant peut passer du processeur au processeur graphique en passant par la mémoire ou encore le stockage de données, même en utilisant des applications identiques.

Dans la configuration testée, des solutions possibles à la baisse de performance avec le modèle à 25 Ferraris pourraient comprendre l'augmentation de la mémoire système, le passage à des processeurs Xeon plus performants, le lancement des applications depuis des disques durs SSD. Quoi qu'il en soit, le Quadro K5000 n'était chargé qu'à 50%, ce qui signifie que, celui-ci alimenté correctement, la performance du modèle aurait pu être doublée.

C'est un parfait exemple illustrant la nécessité de réaliser des tests de configuration avec vos propres données – ce que vous utilisez aujourd'hui ainsi que des exemples représentatifs de ce que vous pensez avoir à traiter l'année prochaine. Nous utilisons 3ds Max et Showcase pour nos tests, mais vous pouvez de la même manière tester un système utilisant CATIA, Deltagen, SolidWorks, Alias Design, Revit, etc. Les mêmes applications avec des ensembles de données différents n'auront pas les mêmes facteurs limitants et vous devrez donc opter pour une configuration spécifique non seulement à l'application mais à votre travail.

Calculs utilisant les processeurs et processeurs graphiques :

Devez-vous utiliser le processeur graphique, le processeur ou les deux lorsque vous recherchez la performance ?

Les deux tests suivants portent sur les performances d'utilisation du processeur uniquement, et les performances de calcul du processeur graphique. Pour ce premier test nous utilisons simplement le mode affichage de lancer de rayon deu logiciel Autodesk Showcase. Showcase n'utilise pas le processeur graphique pour le lancer de rayon (certains programmes le font). Cela rend donc ce test adapté au contrôle des capacités multi-processus du processeur.

Le résultat est simple. Le lancer de rayon charge immédiatement les processeurs Xeon à 100%. Le lancer de rayon est un problème se prêtant bien au calcul en parallèle. Les applications de simulation, d'analyse et d'encodage également.

Donc si vous réalisez ces tâches à longueur de journée et que vos applications ne supportent pas l'utilisation du processeur graphique, procurez-vous les meilleurs processeurs et assurez-vous que le reste de votre système peut en permanence alimenter vos processeurs de manière à les garder à 100% de charge.

Dans le second cas, performance de calcul du processeur graphique, nous avons utilisé Adobe Premiere Pro pour générer une séquence vidéo. La séquence utilise deux pistes vidéo avec différents effets, opacité, correction des couleurs et modification de la vitesse de la vidéo, afin de représenter des tâches courantes qui demandent un travail de calcul important pour générer la vidéo.

Adobe Premiere Pro CS 6 génère la vidéo en utilisant Mercury Playback Engine, ce moteur générant la vidéo de deux manières : en utilisant seulement les processeurs ou en utilisant à la fois processeurs et processeurs graphiques. CADplace a testé les deux.

En utilisant seulement les processeurs, ceux-ci travaillent relativement dur ne serait-ce que pour lire la vidéo durant le processus d'édition. C'est pour cela qu'Adobe peut générer des "prévisualisations". Ces prévisualisations sont des vidéos pré-générées de haute qualité à utiliser durant le processus d'édition.

Générer les prévisualisations prend du temps mais améliore la fluidité du travail sur la vidéo. Cela permet également de générer la vidéo plus rapidement une fois terminée si vous sélectionnez l'option permettant d'utiliser les prévisualisations pour générer la vidéo. D'autre part, dès que vous souhaitez apporter quelque modification que ce soit à une partie du clip – corriger la couleur, changer la vitesse, etc, il vous sera nécessaire de générer à nouveau la prévisualisation pour cette partie, ce qui peut être une bonne excuse pour une pause café.

Comme prévu, générer les prévisualisations a immédiatement chargé tous les coeurs à 100%. Il en va de même pour générer la vidéo sans utiliser de prévisualisation. Dans les deux cas, cela reflète bien la charge du système lors de nos tests de lancer de rayon avec Showcase et devrait être représentatif d'autres domaines tels que la simulation ,l'analyse et une utilisation scientifique. L'utilisation de prévisualisations pour générer la vidéo augmente la vitesse de rendu et les processeurs sont alors tous chargés à 60-75%

Le rendu vidéo par le processeur graphique diffère en plusieurs points. Le premier est spécifique à Premiere Pro en cela que la prévisualisation n'existe plus. La lecture est faite en temps réel, tout comme le rendu final. Cela économise le temps passé à créer des prévisualisations et permet un flux de travail plus efficace sans nécessiter de générer les prévisualisations à nouveau.

Ensuite, une information plus générale, le processeur et le processeur graphique partagent généralement la charge de travail. Contrairement aux calculs dépendant exclusivement du processeur, durant lesquels les coeurs du processeur sont à pleine charge tandis que le processeur graphique est au ralenti, le processeur et le processeur graphique travaillent ici à l'unisson.

Lors des tests d'encodage vidéo, tous les coeurs du processeur étaient chargés à l'identique, mais bien en deçà de 100% d'utilisation. Le Quadro K5000 était utilisé à 50% de ses capacités, mais le programme de contrôle GPU-Z nous a montré que le processeur graphique était chargé par vagues et non à un niveau constant. Cette spécificité soulève quelques observations. Premièrement, il reste de la ressource dans le processeur graphique. Ensuite, le facteur limitant est-il le système, le processeur, la mémoire, le stockage ? Enfin, est-ce dû à l'application et peut-on espérer des mises à jour permettant d'améliorer la répartition des calculs dans cet environnement hétérogène afin de permettre un bond en avant des performances ?

Dans ce but, nous allons voir les performances du système dans le cas d'un rendu vidéo généré par le processeur graphique, par le processeur, d'un rendu de prévisualisation généré par le processeur et enfin d'un rendu vidéo généré par le processeur et utilisant les prévisualisations.

Premiere Pro CS6
  • GPU : rendu final 4:03 (CPU chargé à 70%, Quadro K5000 chargé jusqu'à 50%)
  • CPU : rendu des prévisualisations : 4:01 (CPU chargé à 100%)
  • CPU : rendu final utilisant les prévisualisations, 3:50 (CPU chargé à 70%)
  • CPU : rendu final sans prévisualisations, 12:33 (CPU chargé à 100%)

Particulièrement pour les utilisateurs d'Adobe Premiere Pro, ces résultats indiquent que l'utilisation d'un processeur graphique rend votre flux de travail plus rapide. Cela confirme également ce que les utilisateurs de Premiere Pro utilisant un mode fonctionnant sur processeur uniquement doivent déjà savoir : il est toujours préférable de générer des prévisualisations afin de s'en servir dans le rendu final.

Plus généralement, ce test montre qu'il est courant d'obtenir des améliorations de la performance de 100% ou plus avec l'aide d'un processeur graphique et qu'il est donc pertinent de savoir si vos applications utilisent le calcul par processeur graphique ou si elles peuvent être amenées à le faire.

En ce qui concerne Lenovo, les experts dans le domaine des stations de travail conseillent la configuration NVIDIA Maximus combinant des processeurs graphiques Quadro et Tesla dans la ThinkStation D30 afin de permettre à la fois le fonctionnement des applications graphiques 3D et le calcul passant par le processeur graphique. C'est donc une configuration intéressante pour des professionnels du dessin et de l'ingénierie, gros utilisateurs d'applications 3D et d'applications de calcul du processeur graphique.

Résumé :

Revenons sur nos observations de départ, il est primordial de comprendre comment configurer une station de travail telle que la ThinkStation D30. Il est important de réaliser des tests se basant sur vos propres données car les facteurs limitants peuvent se trouver à divers endroits d'une configuration à l'autre, même en utilisant un application identique. Il est judicieux de ne pas réaliser les tests avec vos données actuelles mais avec ce sur quoi vous pensez travailler sur les 12 – 18 mois à venir. Dans le cas contraire vous risqueriez de tomber dans un piège qu'il vous aurait été facile d'éviter avec une meilleure configuration.

En règle générale, les applications 3D n'ont pas l'utilité de deux processeurs dans une même configuration, tandis que les applications de calcul nécessitent habituellement le plus de coeurs possible. Gardez à l'esprit que de plus en plus d'applications ont recours à la puissance du processeur graphique dans un milieu informatique hétérogène et il serait donc pertinent que votre station de travail possède plusieurs processeurs graphiques.

Cette ThinkStation D30 développe suffisamment de puissance pour venir à bout de vos tâches les plus complexes et son évolutivité ainsi que les diverses options de configuration vous permettent de vous rapprocher au plus près de vos besoins d'aujourd'hui et, plus important encore, ceux de l'année prochaine.