NVIDIA Jetson Xavier / Orin Industrial PCs

Rechner der Jetson Xavier- und der Jetson Orin-Klasse sind sogenannte Systems-on-Chips (SoCs). Sie integrieren alle oder zumindest die entscheidenden Komponenten eines Computers in einer Schaltung. NVIDIA integriert in Jetson-Geräten „klassische“ Prozessoren (CPUs) mit Grafikprozessoren (GPUs: Graphical Processor Units). Jetson Xavier und Jetson Orin sind jeweils ganze Familien von Hardwarelösungen für den Einsatz u.a. in der Robotik, beim Autonomen Fahren sowie beim assistierten Fahren (ADAS: Automatic Driver Assistance System).

Für solche Anwendungen werden – oft von mehreren Kameras gleichzeitig – große Mengen Bilddaten generiert, die fast in Echtzeit verarbeitet werden müssen. Auf den Analysen der Bilddaten basierend trifft eine Künstliche Intelligenz ununterbrochen Entscheidungen über das der jeweiligen Verkehrssituation angepasste Verhalten des Fahrzeugs.

Paralleles Rechnen auf Grafikprozessoren

Die zur Bildverarbeitung benötigten Recheneinzelschritte sind relativ einfach und sie lassen sich gut parallelisieren. GPUs sind weniger komplex als CPUs aufgebaut, aber Hunderte von ihnen analysieren die Bilderflut von den angeschlossenen Kameras gleichzeitig. Das herkömmliche Rechnen durch lineares Durchlaufen von Algorithmen auf einem oder auf wenigen CPUs wird durch paralleles Rechnen auf sehr vielen GPUs stark beschleunigt.

Die Rechenleistungen für die Bildverarbeitung erreichen mit dem GPU-Konzept kaum vorstellbare Dimensionen. Wir sprechen von Größenordnungen von mehreren 100 Billionen Operationen pro Sekunde (eine Billion (1012) Floating Point Operations (FLOPs) sind ein TeraFLOP). Übrigens lassen sich auch andere Aufgaben als die Bildverarbeitung parallelisieren. „Graphical Computing“ kommt auch bei rechenintensiven Aufgaben wie z.B. der wissenschaftlichen Modellierung und bei Simulationen zum Einsatz.

Speziell in Fahrzeugen sind die Hunderte von TeraFLOPS oder kurz „TOPS“ nicht zentral in einem Rechenzentrum zu erbringen, sondern natürlich vor Ort, z.B. in einem fahrenden Fahrzeug: man spricht vom „Edge Computing“. Dabei ist die Strommenge, die in einem Fahrzeug zur Verfügung steht, begrenzt. Es kommt somit nicht nur auf hohe Rechenleistungen für Bildverarbeitung und künstlich intelligente Entscheidungsfindung (Inferenz) an, diese Rechenleistungen müssen zudem mit möglichst wenig elektrische Energie auskommen.

CUDA

Für parallele Berechnungen auf Hunderten bis Tausenden GPUs entwickelte NVIDIA einen „Programmier-Baukasten“ namens CUDA (Compute Unified Device Architecture), der neben einem Compiler und einer Laufzeitumgebung eine große Auswahl an Bibliotheken zur Verfügung stellt. Die Programmierer können mit bewährten Sprachen wie C, C++, Fortran, Python oder Matlab darauf zugreifen. Die GPU-Prozessorkerne und CUDA, also Hard- und Software, sind von NVIDIA aufeinander abgestimmt. CUDA-fähige GPU-Prozessoren heißen daher auch „CUDA-Kerne“.

Orin vs. Xavier

Die Geräte der Jetson Orin-Klasse sind Weiterentwicklungen der Xavier-Klasse. Mit doppelter Speicherkapazität und einem 1,4-fach größeren Arbeitsspeicher erreicht die Orin-Klasse 3,3-fach mehr Leistung als die Xavier-Klasse – gemessen an der Geschwindigkeit der Entscheidungsfindung (angegeben in „Inferenzen pro Sekunde“). Die NVIDIA-Entwickler arbeiten daran, die Orin-Hardware sogar 5-mal schneller als Xavier-Geräte laufen zu lassen.

Folgende Tabelle zeigt, welche Technologien noch dazu beitragen, Orin vor allem beim Deep-Learning leistungsfähiger zu machen als Xavier:

Orin Xavier
Integrierter NVIDIA® Deep Learning Accelerator (DLA) als „Hardware-Beschleunigung“ mittels effizienterer Verarbeitung von Daten. Separate Tensor-Kern-Einheit für Deep-Learning-Operationen, was zu einer höheren Latenz und einem höheren Energieverbrauch führt.
Bis zu 12 ARM v8.2-kompatible CPU-Kerne und bis zu 2048 NVIDIA CUDA-Kerne: höhere Parallelität und Verarbeitungskapazität. Acht ARM v8.2-kompatible CPU-Kerne und 512 NVIDIA® CUDA-Kerne.

Jetson Anwendungen

Typische Anwendungsgebiete sind naheliegenderweise solche, die hohe Rechenleitungen erfordern und bei denen sich die Rechenschritte parallelisieren lassen, z.B.:

  • in der Bildverarbeitung,
  • beim maschinellen Lernen,
  • beim Deep Learning (die eigentliche Künstliche Intelligenz),
  • in der wissenschaftlichen Modellierung etwa der Wetter- und Klimaentwicklung,
  • in Algorithmen für Strömungssimulationen
  • bei der Bildsynthese für Filme und Computerspiele (Rendern).

Die Success Stories auf https://resources.nvidia.com/l/en-us-jetson-success-stories?ncid=no-ncid vermitteln einen Eindruck von der enormen Anwendungsvielfalt von NVIDIA Jetson Geräten in Industrie, Wissenschaft, Medizin und vielen weiteren Gebieten.

NVIDIA Jetson Support

Auf der NVIDIA Webseite findet man außer User Stories auch Online-Dokumentationen, Tutorials, eine FAQ-Seite, das Jetson-Benutzerforum, ein Download-Center und weiteren Support.