NVIDIA étend les capacités des agents d’IA locaux sur les ordinateurs RTX et DGX Spark

En quelques mots

Créé avec l'IA - on travaille encore dessus ! Désolé si ça ne correspond pas tout à fait à vos attentes.

  • NVIDIA présente l'ordinateur personnel RTX Spark, conçu spécialement pour les agents d'intelligence artificielle personnelle dotés de capacités matérielles et logicielles performantes.
  • Partenariat entre NVIDIA et Microsoft visant à créer une plateforme Windows sécurisée pour exécuter des agents d'IA locaux, offrant des ressources pour la gestion de l'identité, la contenance, l'application de politiques et la sécurité de bout en bout.
  • Les ordinateurs de bureau RTX Spark et autres systèmes NVIDIA sont optimisés pour les modèles locaux open source tels que Llama.cpp, permettant des performances d'agent plus rapides et améliorant l'efficacité des inférences.
  • Les ordinateurs RTX Spark sont équipés d'effets de IA tels que la génération de trames vidéo RTX, qui peuvent doubler ou quadrupler les fréquences de trames vidéo en temps réel, ce qui est particulièrement utile pour la création de contenu de IA.

Recommended products

This page contains affiliate links. As an Amazon Associate, we earn a commission from purchases made through these links.

NVIDIA améliore les capacités des agents AI personnels grâce à de nouveaux équipements et logiciels. Lors du NVIDIA GTC Taipei, l’entreprise a présenté le RTX Spark PC, un ordinateur spécifiquement conçu pour les agents personnels, et a annoncé des mises à jour pour étendre l’utilisation locale des agents sur ses systèmes RTX et DGX. Des projets open-source tels qu’Openclaw et Hermes gagnent en popularité parmi les développeurs sur GitHub, mettant en évidence l’adoption croissante des agents personnels. Ces agents peuvent s’adapter aux styles et workflows de l’utilisateur, interagir avec des applications, créer du contenu et automatiser des tâches tout en fonctionnant localement sur un appareil utilisateur. Pour permettre un fonctionnement d’agent privé et sécurisé, un matériel solide est essentiel.

La puissance de calcul en IA de 1 pétaflop et les 128 Go de mémoire unifiée du RTX Spark PC offrent cette capacité, le positionnant comme une nouvelle catégorie d’ordinateur qui fonctionne davantage comme un partenaire collaboratif que comme un simple outil. Conçu pour le travail en Intelligence Artificielle, la création de contenu et les jeux, il incorpore trois décennies d’expertise technologique de NVIDIA dans des notebooks Windows fins et des ordinateurs de bureau compacts dotés de batteries de longue durée. Le partenariat entre NVIDIA et Windows concerne à la fois les solutions personnelles et professionnelles. On a également présenté lors de l’événement la NVIDIA RTX Station, un poste de travail de bureau pour professionnels de l’IA, qui apporte une performance GPU et CPU au niveau du centre de données aux systèmes Windows, permettant des inférences efficaces tout en maintenant sécurité et compatibilité. La capacité à faire fonctionner les agents en privé et rapidement sur les ordinateurs Windows RTX est censée entraîner une adoption généralisée, surmontant ainsi les limites précédentes imposées par des préoccupations de sécurité.

NVIDIA et Microsoft collaborent pour créer une plateforme Windows sécurisée pour exécuter des agents directement sur les appareils. Cette initiative repose sur une base de nouvelles fonctionnalités de sécurité Windows et le runtime Openshell de NVIDIA, garantissant la sécurité des agents et le contrôle de l’utilisateur. Les nouvelles capacités Windows permettent la création native et l’exécution d’agents, notamment la gestion des identités, la contenance, l’application des politiques et la sécurité de bout en bout. Le runtime Openshell permet aux utilisateurs de définir des règles opérationnelles pour les agents, rediriger intelligemment les requêtes vers des modèles locaux en fonction des politiques de confidentialité et masquer les informations personnelles dans les requêtes envoyées vers le cloud. Des projets importants comme Hermes Agent et Openclaw intègrent un cadre robuste de sécurité et de confidentialité dans leurs nouvelles applications Windows. Ces applications permettront aux utilisateurs d’accéder en toute sécurité à des agents locaux capables d’effectuer des tâches au sein des applications Windows, gérer les flux de travail inter-programmes, générer des images et des vidéos, construire des plugins et des applications et effectuer des recherches sémantiques sur les fichiers locaux. L’exécution de ces agents localement nécessite à la fois une sécurité renforcée et un matériel haute performance. Le RTX Spark répond à cela avec une puissance de traitement AI de 1 pétaflop et 128 Go de mémoire unifiée. NVIDIA accélère également l’utilisation de modèles open source locaux pour ces agents.

NVIDIA a collaboré avec l’équipe Llama.cpp pour mettre en œuvre des fonctionnalités telles que la prédiction multi-jetons (MTP). Cette technologie permet à un modèle plus petit de suggérer plusieurs jetons simultanément, que le modèle principal vérifie ensuite en une seule passe. Associée à d’autres optimisations, cette technologie peut permettre des vitesses allant jusqu’à deux fois plus rapides pour des modèles tels que Qwen 3.6 et 3.5, accessibles via l’interface web de Llama.cpp ou LM Studio. NVIDIA a également collaboré avec la communauté open-source pour améliorer les performances dans les outils d’IA locaux populaires chez les utilisateurs disposant de plusieurs GPU.

NVIDIA présente la DGX Spark comme un ordinateur AI de haut niveau pour les professionnels centrés sur l’agent nécessitant un environnement Linux. Elle offre une mémoire importante, des capacités de traitement puissantes et une intégration transparente avec l’écosystème CUDA de NVIDIA. Les dernières mises à jour du système d’exploitation DGX Spark de ce mois se concentrent sur les améliorations de performance, notamment un installateur NeMoCLAW revu et une inférence accélérée pour les modèles d’agent populaires. NeMoCLAW est maintenant disponible sur tous les ordinateurs NVIDIA RTX et DGX exécutant Linux ou le sous-système Windows pour Linux. De plus, déployer des agents locaux dans des environnements Linux est maintenant plus sécurisé grâce à des installateurs simplifiés avec auto-sandboxing et un support amélioré de l’agent Hermes. La collaboration de NVIDIA avec VLLM a permis d’améliorer les performances de l’inférence de l’agent sur la DGX Spark jusqu’à 2,6 fois par rapport aux points de contrôle NVFP4 précédents d’Unsloth, grâce à des améliorations du noyau, à la précision mixte et au support CUDA Graph pour MTP. Les modèles Quantized Holo Computer Use, développés par NVIDIA et The H Company, sont maintenant disponibles. Ces modèles offrent une vitesse deux fois plus rapide et utilisent 35 % moins de mémoire sur les GPUs NVIDIA. L’application Holo Desktop est prévue pour sortir prochainement, avec des optimisations de l’agent Linux également en développement.

Optimisation du contenu IA avec un boost du taux de trames en temps réel sur les ordinateurs RTX Spark via la génération de trames vidéo RTX

Les nouveaux ordinateurs RTX Spark introduisent la génération de trames vidéo RTX, un effet IA capable de doubler ou quadrupler le taux de trames vidéo en temps réel. Cette fonctionnalité est particulièrement utile pour le contenu généré par les modèles IA qui produisent généralement des taux de trames plus bas, autour de 15 à 20 images par seconde. Disponible sous forme de package Python wheel et d’un nœud pour ComfyUI, cette fonctionnalité permet aux artistes de créer des vidéos avec un taux de trames plus bas puis de les lisser pour la lecture.

Au cas où vous l’auriez manqué

Intrigué par notre dernière analyse approfondie des dernières tendances du jeu vidéo ? Vous êtes gâté avec trois articles incontournables publiés cette semaine ! Carlos Mendoza explore comment TCL bouleverse le marché des moniteurs de jeux avec sa gamme ambitieuse d’affichages haut de gamme à des prix étonnamment abordables, du premier affichage OLED aux modèles orientés esports. Découvrez « TCL mise gros sur le gaming » TCL mise sur le gaming : écrans OLED, Mini LED, modèles esports à prix agressifs. Dans l’intervalle, Marcus Thompson vous présente des nouvelles excitantes concernant le retour de la série Teenage Mutant Ninja Turtles avec « Teenage Mutant Ninja Turtles : The Last Ronin ». Ce jeu d’action-aventure promet une prise plus sombre et mature sur les célèbres tortues, explorant des thèmes de deuil, vengeance et legs. Avec PlatinumGames à la barre, attendez-vous à rien de moins qu’un combat et une narration spectaculaires dans cet avenir alternatif où seul un guerrier tortue reste pour affronter le puissant clan Foot dirigé par le petit-fils de Shredder. Plongez maintenant dans le chaos : Teenage Mutant Ninja Turtles : The Last Ronin ressuscité par Paramount Games Studio et PlatinumGames. Enfin, Marcus Thompson partage également un aperçu complet des plans d’Io Interactive pour l’extension post-lancement de leur jeu-phare « 007 First Light », qui a déjà vendu plus de 2,7 millions d’exemplaires sur plusieurs plateformes. Avec de nouvelles missions en mode Tacsim, une prise en charge améliorée du Path Tracing et des ajouts intrigants tels que les lunettes G2 en approche, il y a beaucoup à attendre ! Ne manquez pas ça ; consultez-le ici 007 : Les ventes de First Light continuent d’être florissantes.