Die nächste im IBM Telum-Prozessor verbaute Chip-Generation ermöglicht die Nutzung von künstlicher Intelligenz in Transaktionen und verbessert damit z.B. die Möglichkeiten zur Betrugsbekämpfung erheblich.

Auf der jährlichen Hot Chips-Konferenz hat IBM Details zum IBM Telum-Prozessor vorgestellt. Mit seiner On-Chip- Beschleunigung für KI soll es der branchenweit erste Prozessor sein, der Kunden Anwendern – basierend auf Deep Learning – die Nutzung von KI-Inferenz innerhalb zeitkritischer Transaktionen erlaubt.

Dazu wartet Telum im Vergleich zu anderen Serverprozessoren mit der zehnfachen Rechenleistung pro Core für KI-Aufgaben auf und ermöglicht so Fortschritte etwa in der Betrugsbekämpfung, bei Entscheidungen über Kreditvergaben, in der Schadensregulierung und im Finanzhandel. Telum wurde in den letzten drei Jahren entwickelt und basiert laut IBM auf Hunderten von Patenten. Ein IBM-System, das die Vorteile von Telum nutzt, wird voraussichtlich in der ersten Hälfte des Jahres 2022 verfügbar sein.

In einer von IBM in Auftrag gegebenen Studie gaben 90 Prozent der Befragten an, dass die Nutzung von Transaktionsdaten sowie die Möglichkeit, KI-Projekte dort zu erstellen und durchzuführen, wo sich diese Daten befinden, entscheidend sind, um Echtzeit-Einblicke in Geschäftsprozesse zu erhalten. IBM Telum ist so konzipiert, dass Anwendungen effizient dort ausgeführt werden können, wo sich die Daten befinden.

Zudem hilft der Prozessor dabei, herkömmliche KI-Nachteile zu überwinden, da oftmals erhebliche Speicher- und Datenverschiebungskapazitäten erforderlich sind, um Inferenzen zu verarbeiten. Mit Telum befindet sich der Beschleuniger in unmittelbarer Nähe zu geschäftskritischen Daten und Anwendungen. Dadurch sollen Unternehmen in der Lage sein, ein hohes Inferenzvolumen für sensible Echtzeit-Transaktionen durchführen zu können, ohne auf KI-Lösungen außerhalb der Plattform zurückgreifen zu müssen. Anwender können zudem KI-Modelle außerhalb der Plattform erstellen und trainieren und auf einem Telum-fähigen IBM-System zur Analyse bereitstellen und inferieren.

Der neue Chip zeichnet sich durch ein zentralisiertes Design aus. Dadurch können Anwender die volle Leistung des KI-Prozessors für KI-spezifische Workloads nutzen. Das prädestiniert ihn für zahlreiche Aufgaben im Finanzdienstleistungsbereich, wie etwa Betrugserkennung, Kreditverarbeitung, Clearing, Geschäftsabwicklung, Geldwäschebekämpfung und Risikoanalyse: KI-Algorithmen inklusive Machine Learning und Deep Learning versetzen Kunden in die Lage, die bestehende Betrugserkennung weiterzuentwickeln, Kreditgenehmigungsprozesse zu beschleunigen, den Kundenservice und die Rentabilität zu verbessern. Zudem lassen sich genauere Vorhersagen treffen, welche Geschäfte oder Transaktionen fehlschlagen werden, und Lösungen vorschlagen, um Abwicklungsprozesse effizienter zu gestalten.

Full-Stack-Ansatz für das Chipdesign

Durch sein neuartiges Design unterstützt der in Telum verbaute KI-Beschleuniger eine Vielzahl von Modelltypen und erreicht dabei für alle eine führende Effizienz. Mit Telum lassen sich Zehntausende von KI-integrierten Transaktionen pro Sekunde verarbeiten.
Der Chip enthält acht Prozessorkerne mit einer superskalaren Out-of-Order-Befehlspipeline, läuft mit einer Taktfrequenz von mehr als 5 GHz und ist für die Anforderungen heterogener Workloads optimiert.

Die völlig neu gestaltete Cache- und Chip-Verbindungsinfrastruktur bietet 32 MByte Cache pro Kern und ermöglicht den Aufbau von Systemen mit bis zu 256 physischen Kernen. Der Chip enthält 22 Milliarden Transistoren und 30 km an Leiterbahnen verteilt auf 17 Metallschichten. (rhh)

IBM