NVIDIA erweitert die Fähigkeiten lokaler KI-Agenten auf RTX und DGX Spark Rechnern

Das Wichtigste in Kürze

Mit KI erstellt - wir experimentieren noch damit! Entschuldigung, falls es nicht ganz Ihren Erwartungen entspricht.

  • NVIDIA führt den RTX Spark PC ein, einen Computer, der speziell für persönliche künstliche Intelligenz-Agenten mit hochleistungsfähiger Hardware und Software ausgelegt ist.
  • Partnerschaft zwischen NVIDIA und Microsoft zielt darauf ab, ein sicheres Windows-Betriebssystem für den Betrieb lokaler AI-Agenten zu schaffen, das Ressourcen für die Identitätsverwaltung, Abgrenzung, Politikumsetzung und end-to-end-Sicherheit bereitstellt.
  • Die RTX Spark PC und andere Systeme von NVIDIA werden für offene lokale Modelle wie Llama.cpp optimiert, was zu schnellerer Agentleistung und verbessertem Inferenzeffizienz führt.
  • Die Computersysteme der Marke RTX Spark verfügen über künstliche Intelligenz-Effekte wie die RTX Video Rahmenerzeugung, die es ermöglichen, Video-Rahmenraten im Echtzeitbetrieb verdoppeln oder viertupeln. Das ist besonders nützlich für die Erstellung von AI-Inhalten.

Recommended products

This page contains affiliate links. As an Amazon Associate, we earn a commission from purchases made through these links.

NVIDIA forciert die Fähigkeiten persönlicher Künstliche Intelligenz-Agenten durch neue Hardware und Software. Bei der NVIDIA GTC Taipei brachte das Unternehmen den RTX Spark PC ein, ein Computer, der speziell für persönliche Agenten entwickelt wurde, und kündigte Updates an, um die lokale Agentennutzung in seinen RTX und DGX-Systemen zu erweitern. Open-Source-Projekte wie Openclaw und Hermes sind bei Entwicklern auf GitHub beliebt geworden, was den wachsenden Anwendungsbedarf persönlicher Agenten hervorhebt. Diese Agenten können sich an die Bedürfnisse des Benutzers anpassen, mit Applikationen interagieren, Inhalt erstellen und Aufgaben automatisieren, ohne dass es zu einer Verarbeitung auf einem Drittgerät kommt. Um privaten und sicheren Agentenbetrieb zu ermöglichen, ist robuste Hardware unabdingbar.

Das RTX Spark PC bietet diese Fähigkeit mit 1 Petaflop AI-Rechenleistung und 128GB vereinigter Speicher, wodurch es als eine neue Kategorie von Computer funktioniert, der mehr wie ein kooperativer Partner als nur ein Werkzeug wirkt. Entwickelt für AI-Arbeit, Inhaltserstellung und Computerspiele, beinhaltet es die technische Expertise von NVIDIA über drei Dekaden in schlanken Windows Notebooks und kompakten Desktops mit langwierigen Akkus. Die Zusammenarbeit zwischen NVIDIA und Windows umfasst sowohl persönliche als auch Unternehmenslösungen. Außerdem wurde bei der Veranstaltung das NVIDIA RTX Station vorgestellt, eine Arbeitsbank für AI-Experten, die die GPU- und CPU-Leistung eines Datenzenters auf Windows-Systeme bringt, um die Effizienz des Inferenzbetriebs zu gewährleisten, ohne dass Sicherheit oder Kompatibilität leiden würde. Die Möglichkeit, privat und schnell auf Windows RTX PCs Agents auszuführen, wird erwartet, die breite Adoption anzuregen, indem sie die früheren Sicherheitsbeschränkungen überwindet.

NVIDIA und Microsoft arbeiten zusammen, um ein sicheres Windows-Plattform für die direkte Ausführung von Agenten auf Geräten zu schaffen. Diese Initiative basiert auf einer Grundlage neuer Sicherheitsmerkmale des Windows und des OpenShell-Laufzeitanfangs von NVIDIA, um die Sicherheit der Agenten und die Kontrolle der Nutzer sicherzustellen. Neue Fähigkeiten von Windows bieten Ressourcen für die nativene Erstellung und Ausführung von Agenten, darunter Identitätsmanagement, Containment, Politikumsetzung und end-to-end-Sicherheit. Das OpenShell-Produkt von NVIDIA ermöglicht es den Nutzer, Operativregeln für die Agenten festzulegen, intelligente Abfragen an lokale Modelle auf Basis der Datenschutzrichtlinien zu leiten und persönliche Informationen in Wolkenabfragen zu verbergen. Prominente Projekte wie Hermes Agent und Openclaw integrieren einen umfassenden Sicherheits- und Privatschutzrahmen in ihre neuen Windows-Anwendungen. Diese Anwendungen ermöglichen es den Nutzer, lokale Agenten mit der Fähigkeit zu sichern, im Umfeld von Windows-Apps Aufgaben auszuführen, die interprogrammare Arbeitsabläufe verwalten, Bilder und Videos erstellen, Plugins und Anwendungen bauen und semantische Suchen auf lokalen Dateien durchführen. Die Ausführung dieser Agenten lokal erfordert beide starke Sicherheit und hohe Leistungsfähigkeit. Das RTX Spark beseitigt dieses mit einer AI-Rechenleistung von 1 Petaflop und 128GB vereinigter Speicher. NVIDIA beschleunigt zudem die Verwendung lokaler offener Modelle für diese Agenten.

NVIDIA arbeitet zusammen mit dem Team von Llama.cpp, um Funktionen wie die Mehrtokensprognose (MTP) zu implementieren. Diese Technologie ermöglicht es einem kleineren Modell, gleichzeitig mehr Tokens vorzusagen, die das Hauptmodell dann in einer einzelnen Durchlaufung überprüft. Kombiniert mit anderen Optimierungen, kann dies Geschwindigkeiten bis zu doppelt so schnell für Modelle wie Qwen 3.6 und 3.5 erreichen, die über die Web-Schnittstelle von Llama.cpp oder das LM Studio zugänglich sind. NVIDIA arbeitet außerdem mit der offenen Source-Community zusammen, um die Leistung in beliebten lokalen KI-Werkzeugen für Benutzer mit mehreren GPUs zu steigern.

Der NVIDIA DGX Spark wird als Spitzenleistungs-AI-PC für berufliche Agenten im Linux-Umgebung präsentiert. Er bietet umfangreiches Speicherangebot, starke Verarbeitungsleistung und flüssiges Integrationskonzept in das CUDA-Ökosystem von NVIDIA. Die aktuellen OS-Updates des DGX Spark im diesen Monat konzentrieren sich auf Leistungsverbesserungen, darunter ein überarbeitetes NeMoCLAW-Installationsprogramm und beschleunigte Inferenz für beliebte Agentmodelle. NeMoCLAW ist nun auf allen NVIDIA RTX und DGX PCs unter Linux oder dem Windows Subsystem für Linux verfügbar. Weiterhin ist die Bereitstellung von lokalen Agenten in Linux-Umgebungen sicherer geworden, da mit einfachen Installern die automatische Sandboxing und eine verbesserte Unterstützung des Hermes Agents verfügbar sind. Die Zusammenarbeit von NVIDIA mit VLLM hat dazu geführt, dass die Agent-Inferenzleistung um bis zu 2,6 Mal gesteigert werden konnte im Vergleich zu den vorherigen NVFP4-Checkpoints von Unsloth auf dem DGX Spark durch Verbesserungen der Kernel, Mischberechnung und CUDA Graph-Unterstützung für MTP. Die von NVIDIA und The H Company entwickelten Holo Computer Use Models sind nun verfügbar. Diese Modelle bieten eine Verdoppelung der Geschwindigkeit und nutzen 35 % weniger Speicher auf NVIDIA-GPUs. Der Holo Desktop app wird bald veröffentlicht, wobei auch die Optimierung von Linux-Agenten im Entwicklungsstand ist. **Optimierung von AI-Inhalt mit Real-zeitiger Rahmenrate-Verstärkung auf RTX Spark Computern über RTX Video Frame Generation**

Die neuen RTX Spark Computers stellen RTX Video Frame Generation vor, einer künstlichen Intelligenz-Wirkung, die bei Videos in Echtzeit das Rahmenrateverhältnis um das Doppelte oder Vielfache verbessern kann. Dies ist besonders hilfreich für Inhalte, die von künstlichen Modellen erzeugt werden, die üblicherweise eine niedrigere Rahmenrate aufweisen – etwa 15 bis 20 Rahmen pro Sekunde. Diese Funktion steht als Python-Wheel-Paket und Knoten für ComfyUI zur Verfügung und ermöglicht Künstlern die Erstellung von Videos mit niedrigerer Rahmenrate, die später gesmoothgedownet werden können.

Falls Sie es verpasst haben

Stimmt Ihnen unser letzter tiefen Eintauch in die neuesten Trends im Spielbereich gefallen? Dann sind Sie mit drei Muss-lesen-Artikeln, die diesen Wochen veröffentlicht wurden, wirklich gut dabei! Carlos Mendoza erforscht, wie TCL das Marktsegment der Gaming-Monitore umstürzt, indem sie eine ambitionierte Reihe hochwertiger Displays an überraschend niedrigen Preisen auf den Markt bringen. Unter anderen wird die erste OLED-Anzeige sowie Modelle für eSports präsentiert. Schauen Sie sich „TCL setzt auf Gaming“ TCL setzt groß auf das Spielen: OLED, Mini-LED-Bildschirme und Esport-Modelle zu attraktiven Preisen an. Währenddessen teilt Marcus Thompson Sie über die Rückkehr der Teenage Mutant Ninja Turtles-Serie mit „Teenage Mutant Ninja Turtles: The Last Ronin“ mit, eine actionreiche Abenteuer-Spiel, das ein dunkleres und reiferes Bild von den geliebten Schildkröten zeigt und sich mit Themen wie Trauer, Rache und Nachwirkung beschäftigt. PlatinumGames steuert die Regie, sodass Sie nichts als spektakuläre Kämpfe und Storytelling in diesem alternativen Zukunftszeitpunkt erwarten können, in dem nur noch ein Schildkrötenkrieger auftritt, um gegen den mächtigen Fußklan des Enkels von Shredder anzukämpfen. Tauchen Sie jetzt ins Chaos ein: Teenage Mutant Ninja Turtles: The Last Ronin – Von Paramount Games Studio und PlatinumGames wiederbelebt. Zuletzt teilt Marcus Thompson auch eine umfassende Vorstellung der Pläne von Io Interactive für die post-Launch-Erweiterung ihres Hitspiels „007 First Light“ mit, das bereits über 2,7 Millionen Mal auf verschiedenen Plattformen verkauft wurde. Mit neuen Missionen in Tacsim-Modus, verbessertem Path Tracing und interessanten Neuerungen wie den G2-Brillen auf dem Weg sind es vieles, was man erwarten kann! Nichts verpassen; schauen Sie es sich hier 007 First Light Fortsetzt das Erfolgen: Umsatzübersicht und Detailplan der Roadmap an.