Daten stehen im Zentrum eines jeden KI-Szenarios. Ohne ein ausreichend umfangreiches Fundament können Unternehmen die intelligenten Algorithmen nicht erfolgreich trainieren und auf den jeweiligen Anwendungszweck hin zuschneiden. Doch Quantität allein garantiert noch keinen KI-Erfolg. Denn wirklich nutzbar sind Trainingsdaten nur, wenn sie in ihrem zugehörigen Kontext vorliegen. Entsprechend gilt es für Unternehmen, die ihre KI-Reise beginnen wollen, drei zentrale Grundsätze zu beachten.
Smarte Sprachsteuerung oder intelligente Assistenzsysteme bei der Autofahrt: Im Kontext der privaten Medien- und Gerätenutzung haben KI-Technologien bereits seit geraumer Zeit Einzug gehalten. Auch Unternehmen wollen sich mehr und mehr die Vorteile der Zukunftstechnologie zunutze machen und arbeiten an Szenarien, die ihre Geschäftsprozesse oder Services für den Wettbewerb der kommenden Jahre fit machen können.
Um für deren Umsetzung bestens gerüstet zu sein, sammeln nicht wenige bereits heute große Mengen von Daten und häufen damit Reservoirs an, aus denen bei Bedarf KI-Algorithmen lernen könnten. Eine solche Voraussicht ist in der Tat sinnvoll. Doch Masse allein genügt nicht, damit KI-Szenarien tatsächlich zum Erfolg führen.
Eine ebenso große Rolle spielt der Kontext, in dem die Daten entstanden sind. Im Fertigungskontext können dies beispielsweise die zeitliche Synchronisierung sein, die Störungen oder die Produktion von Ausschuss mit genau den Maschinenparametern zusammenbringt, die zum jeweiligen Zeitpunkt vorlagen. Wurden beide Informationen separat erfasst, jedoch nicht zeitlich miteinander verbunden, wird ein KI-Algorithmus nicht in der Lage sein, Gründe für die Störungen zu identifizieren. Haben Unternehmen nicht von Anfang an für den erforderlichen Kontext gesorgt, muss dieser im schlimmsten Fall durch manuelle Bearbeitung des Datensatzes mühsam hergestellt werden.
Um Rückschläge wie diese zu vermeiden, sollten Unternehmen bereits vor Beginn ihrer Datenerfassung drei zentrale Grundsätze beherzigen und so von Anfang an die besten Voraussetzungen schaffen, bei Bedarf unmittelbar vom vorhandenen Datensatz profitieren zu können.
Daten müssen zweckmäßig sein
Einer der wichtigsten Faktoren für eine solide Datenerfassung ist eine klare Zieldefinition. Zu welchem Zweck sollen die gesammelten Daten später einmal genutzt werden? Welche Erkenntnisse sollen gewonnen werden? Auf Basis dieser Ausgangslage können Unternehmen im zweiten Schritt die Parameter definieren, die erforderlich sein könnten, um Antworten auf die entsprechenden Fragen zu liefern – also zweckmäßig sind.
Ein Beispiel: Ein Landwirt, der mit einem smarten Mähdrescher den Ertrag unterschiedlicher Getreidesorten an mehreren Standorten untersuchen will, muss andere Parameter analysieren als ein Kollege, der den Zustand der einzelnen Komponenten seines Mähdreschers zum Zwecke der vorausschauenden Wartung überwachen will. Wer seine Datenerfassung ohne vorab definiertes Ziel startet, riskiert, unnötig Ressourcen für den Aufbau eines Reservoirs aufzuwenden, das letzten Endes nicht für den geplanten Zweck genutzt werden kann.
In der praktischen Umsetzung können teilweise schon kleine Anpassungen im Erfassungsprozess den Unterschied zwischen nutzbaren und ungeeigneten Datensätzen ausmachen: Eine kleine Änderung in der Konfiguration eines Manufacturing Execution System (MES) etwa kann dazu führen, dass alle übermittelten Produktivdaten automatisch mit einem korrekten Zeitstempel versehen sind.
Daten müssen konsistent gesammelt werden
Neben der möglichst konkreten Zieldefinition sollte auch eine hohe Robustheit der Datenerfassung sichergestellt werden. Um einen konsistenten Datensatz zu erhalten, muss der Erfassungsprozess so implementiert werden, dass er nicht nur einige Wochen oder Monate solide und immer gleich abläuft, sondern im besten Fall über Jahre hinweg. Je nach Szenario sollten Unternehmen dabei auch einen Übertragungsweg wählen, über den sichergestellt ist, dass Daten langfristig in konstant hoher Qualität erfasst und gespeichert werden können.
Handelt es sich bei den zu erfassenden Daten hauptsächlich um Informationen, die inhouse gesammelt werden, lässt sich in der Regel recht einfach für eine stabile und konsistente Datenerfassung sorgen. Deutlich komplexer wird der entsprechende Prozess, wenn Unternehmen beispielsweise Daten aus verschiedenen Niederlassungen oder gar Kundensystemen im weltweiten Praxiseinsatz über einen langen Zeitraum sammeln möchten. In Fällen wie diesen kann es sich lohnen, einen externen Datenspezialisten ins Boot zu holen, der das geplante Vorgehen auf seine Tauglichkeit untersuchen kann.
Daten müssen frühzeitig erfasst werden
Ein konkretes Ziel, eine robuste Erfassungsmethode – die Planung eines erfolgreichen KI-Szenarios gelingt nicht ohne Aufwand. Für viele Unternehmen mag dies abschreckend wirken, sodass die Auseinandersetzung mit der neuen Technologie ein ums andere Mal verschoben wird. Schließlich sind Kapazitäten nicht selten mit dem Tagesgeschäft bereits vollständig ausgelastet. Doch darin liegt ein Risiko: Auch wenn Quantität nicht der einzige Faktor für erfolgreiche KI-Analysen ist, ist sie dennoch ein zentraler. Es gilt daher nach wie vor, so früh wie möglich mit der Erfassung der relevanten Daten inklusive des erforderlichen Kontextes zu beginnen.
Besteht bei der Planung der KI-Aktivitäten noch kein geeigneter Datenpool, muss das Unternehmen zunächst mit dessen Aufbau beginnen. Abhängig vom geplanten Anwendungszweck sind dafür jedoch in der Regel mindestens sechs, idealerweise zwölf und mehr Monate an historischen Daten vonnöten, um sicherzustellen, dass diese aussagekräftig genug sind, um eine künstliche Intelligenz erfolgreich daran zu trainieren. Mitbewerber, die bereits seit längerer Zeit erforderliche Daten erfasst haben, sind dann kaum mehr einzuholen.
KI-Nutzung mit Plan
Die digitale Transformation erfordert Zeit. Entsprechend gilt es, dafür erforderliche KI-Szenarien mit einem soliden Plan anzugehen und mit einer überlegten Strategie mit der Datengewinnung zu beginnen. Nur so legen Unternehmen die Basis, am Ende der Digitalisierungsreise tatsächlich am gewünschten Ziel anzukommen, und nicht – im schlimmsten Fall – wieder ganz am Anfang zu stehen.
Marco Bux ist Senior Product Manager bei Asseco Solutions.