Wie gut passt die Power-Architektur zu den vielen Lösungen, die mittlerweile auf Künstliche Intelligenz (KI) setzen und wo liege die Vorteile gegenüber KI-Umgebung, die auf Grafikprozessoren basieren? Diese Frage hat Dr. Sebastian M. Lehrig, „WW AI on IBM Power Leader“ bei IBM, beantwortet.
Die aktuelle Power10-Architektur richtet sich an existierenden und aufkommenden KI-Technologien aus, indem sie die Basis für eine Infrastruktur schafft, in welcher das Betreiben von KI-Modellen zum Alltag gehört. Der aktuelle Trend vor allem um generative KI deutet klar an, dass KI-Modelle mehr und mehr Einzug in geschäftskritische Anwendungen halten. In diesem Kontext sind ganz klassische Eigenschaften aus dem IT-Betrieb wie Sicherheit, Zuverlässigkeit und Verfügbarkeit nicht wegzudenken, insbesondere für KI-Modelle.
IBM Power10 wendet diese Eigenschaften auf KI-Modelle an und erweitert sie für KI, sodass Modelle wie z.B. große Sprachmodelle mit der notwendigen Beschleunigung auf jedem Power10-Chip betrieben werden können. Die Beschleunigung erlaubt es, Modelle direkt dort, wo sie benötigt werden, mit entsprechender Latenz und entsprechendem Durchsatz zu betreiben.
So können Modelle zusammen mit geschäftskritischen Daten, Applikationen und Transaktionen betrieben werden, oft also nah an Datenbanken aus dem Db2-, Oracle- und SAP-Umfeld. Diese Fähigkeit gibt dem IT-Betrieb hinreichend Kontrolle, um die Applikationsarchitektur einfach zu gestalten (mit minimalen Daten- und Kontrollflüssen hin zum KI-Modell; ohne “single point of failures”).
So werden neben Latenzen/Durchsatz auch die Sicherheit optimiert, dank minimaler potentieller Angriffsvektoren. Der auf Power angebotene Software-Stack sowohl aus dem Enterprise- als auch aus dem Open-Source-Bereich ist auf genau diese Anwendungsszenarien optimiert und spielt die in der Hardware verfügbaren Fähigkeiten entsprechend aus. Hierzu gehören insbesondere ganz typische Technologien, die in gängigen Lösungen eingesetzt werden, wie z.B. PyTorch, TensorFlow, ONNX und Huggingface-Bibliotheken.
Im Vergleich mit reinen Grafikprozessor-Umgebungen erlauben IBM Power10 Server vor allem eine effiziente Konsolidierung der KI-Workloads. Modellnutzung benötigt keine zusätzlichen, externen Beschleuniger mehr, wodurch der IT-Betrieb einfacher, ökonomischer und nachhaltiger wird. Ein Verfeinern von existierenden KI-Modellen wie z.B. für Llama 2 (ein bekanntes großes Sprachmodell aus dem Open Source Bereich) ist ebenfalls ohne zusätzliche Grafikprozessoren möglich.
Ein solches Verfeinern von Basismodellen wird zudem immer mehr die Norm bei der Entwicklung von KI-Modellen. Nur für Fälle, wo große neuronale Netze von Null an trainiert werden müssen, werden noch dedizierte Grafikprozessoren benötigt, die dann ggf. nach Bedarf aus Cloud-Computing-Umgebungen oder aus eigenen Grafikprozessor-Clustern bezogen werden können. Hierbei können KI-Modelle nahtlos zwischen x86- und Power-basierten Architekturen ausgetauscht werden. Insgesamt trägt IBM Power10 somit zu einem ökonomischeren Betrieb von KI-Technologien bei und minimiert so den Bedarf an Grafikprozessor-Ressourcen.
Dr. Sebastian M. Lehrig ist „WW AI on IBM Power Leader“ bei der IBM.