Mit der NVIDIA KI-Plattform und dem Full-Stack-Ansatz ist L4 für Video und Inferenzen in großem Umfang für eine breite Palette von KI-Anwendungen optimiert, darunter Empfehlungen, sprachbasierte KI-Avatar-Assistenten, generative KI, visuelle Suche und Contact-Center-Automatisierung, um ein großartiges personalisiertes Erlebnis zu bieten. Als extrem effizienter NVIDIA-Beschleuniger für den Mainstream ermöglichen mit L4 ausgestattete Server eine bis zu 120-fach höhere KI-Videoperformance im Vergleich zu CPU-Lösungen, während die generative KI-Leistung um das 2,7-fache und die Grafikleistung um das 4-fache höher ist als bei der vorherigen Generation. Die Vielseitigkeit des NVIDIA L4 und sein energieeffizienter, flacher Formfaktor mit nur einem Steckplatz machen ihn ideal für den globalen Einsatz, auch in Randbereichen. Mit der zunehmenden Verbreitung von KI und Video steigt die Nachfrage nach effizientem, kostengünstigem Computing mehr denn je. NVIDIA L4-GPUs bieten eine bessere Energieeffizienz und niedrigere Gesamtbetriebskosten im Vergleich zu herkömmlichen CPU-basierten Infrastrukturen. Dies ermöglicht es Unternehmen, den Platzbedarf im Rack zu reduzieren und den gesamten CO2-Fußabdruck deutlich zu verringern, während ihre Rechenzentren in der Lage sind, für viel mehr Benutzer zu skalieren.
Highlight
Tensor Cores der vierten Generation Die fortschrittlichen Tensor-Cores mit Ada Lovelace-Architektur wurden entwickelt, um transformative KI-Technologien wie intelligente Chatbots, generative KI, natürliche Sprachverarbeitung (NLP), Computer Vision und NVIDIA Deep Learning Super Sampling 3.0 (DLSS 3) zu beschleunigen. Ada Lovelace Tensor Cores entfesseln strukturierte Sparsamkeit und 8-Bit-Gleitkomma-Präzision (FP8) für eine bis zu viermal höhere Inferenzleistung als die vorherige Generation. FP8 reduziert den Speicherdruck im Vergleich zu größeren Genauigkeiten und beschleunigt den KI-Durchsatz erheblich.
RT-Kerne der dritten Generation Mit der Erfindung der RT Cores, den Rechenkernen auf dem Grafikprozessor, die speziell für das leistungsintensive Raytracing-Rendering entwickelt wurden, hat NVIDIA das Raytracing in Echtzeit Wirklichkeit werden lassen. Die RT Cores der dritten Generation von Ada Lovelace haben einen doppelt so hohen Durchsatz bei der Durchdringung von Raytracing-Dreiecken und steigern die RT-TFLOP-Leistung um mehr als das Doppelte. NVIDIA Shader Execution Reordering (SER) verbessert die Leistung um mehr als das Dreifache und ermöglicht so tiefgreifende Erlebnisse für virtuelle Welten und eine noch nie dagewesene Produktivität für KI-basierte neuronale Grafiken und Cloud-Gaming.
Erweiterte Video- und Vision-KI-Beschleunigung Mit einem optimierten AV1 Stack hebt der NVIDIA L4 die Video- und Vision-KI-Beschleunigung auf die nächste Stufe und schafft eine breite Palette zusätzlicher Möglichkeiten für Anwendungsfälle wie Echtzeit-Videotranscoding, Streaming, Videokonferenzen, Augmented Reality (AR), Virtual Reality (VR) und Vision-KI. Mit vier Video-Decodern und zwei Video-Encodern in Kombination mit dem AV1-Videoformat können L4-Server über 1000 gleichzeitige Videoströme hosten und bieten eine 120-mal höhere KI-Video-End-to-End-Pipeline-Leistung als CPU-Lösungen. Darüber hinaus beschleunigen vier JPEG-Dekoder Anwendungen, die eine hohe Bildverarbeitungsleistung benötigen, weiter.