Welche Technologien sollte man heutzutage einsetzen, um die Zusammenhänge in Daten-Pools herausarbeiten zu können – zu dieser und anderen Fragen bezieht Stefan Held gegenüber Midrange Mail (MM) Stellung. Für den Teamleiter Softwarelösungen West bei der PROFI Engineering Systems AG hängt das im Wesentlichen von der Art der vorhandenen Daten und der Fragestellung ab sowie von den Skills der verfügbaren Mitarbeiter.

Generell gebe es laut Held sehr gute Open-Source-Werkzeuge, die ein bisschen Datascience- und Programmiererfahrung erfordern, aber auch anwenderorientierte Werkzeuge mit z. B. Automining-Funktionen, die gut sind, um erste Zusammenhänge in Datenbeständen zu entdecken. „Wichtig ist, sich erst einmal Gedanken zu machen,“, so Held weiter, „welche Ziele man mit der Untersuchung verfolgt. Manchmal liefert eine einfache Visualisierung herausgegriffener Größen erste interessante Anhaltspunkte. Eine gute Beratung kann diesen Prozess unterstützen.“

MM: Wie sollten mittelständische Unternehmen die nötigen Anforderungen an die Bereitstellung und Verwaltung der Speicherkapazität angehen?
Held: Moderne Analyseplattformen können gleichermaßen mit Cloud- wie lokalen Daten umgehen. Gerade in der Pilotphase eines Big-Data-Projekts kann eine Speicherung in der Cloud die Startzeit deutlich verkürzen und damit das Herausstellen eines tatsächlichen Projektnutzens beschleunigen. Das wiederum ist wichtig für die folgenden Entscheidungen, in Big-Data-Lösungen zu investieren. Technisch ist Speicherkapazität in der Regel kein Problem, aber Bereitstellung und Betrieb sollten so niedrige Hürden wie nur möglich bilden.

Quelle: PROFI Engineering Systems AG

Stefan Held, Teamleiter Softwarelösungen West bei der PROFI Engineering Systems AG: „Data Engineers und Data Scientists müssen Hand in Hand arbeiten.“

MM: Welche Rolle fällt dabei Spezialisten wie Data Engineers, Data Scientists etc. zu?
Held: Beide müssen Hand in Hand arbeiten. Die einen sorgen für eine reibungslose Datenversorgung und -aufbereitung, verbinden Pools unterschiedlicher Art und Herkunft auf einer inhaltlichen, logischen Ebene zu einem nutzbaren Analysedatenbestand. Die anderen finden die verborgenen Schätze darin, beherrschen das Spiel mit den unterschiedlichen statistischen Methoden und Mustererkennungsverfahren. Die dritte wichtige Rolle in dem Prozess haben die Fachspezialisten, die Ansätze und Ergebnisse immer wieder inhaltlich bewerten müssen, bis sich ein schlüssiges Bild ergibt.

MM: Wie kann ein mittelständisches Unternehmen diese Kompetenz im eigenen Unternehmen fördern und bereitstellen?
Held: Durch Zusammenarbeit und den unerlässlichen Blick über den Tellerrand des eigenen Verantwortungsbereiches in Verbindung mit einem gesunden Maß an Neugier, was möglich ist. Bei niedrigen Einstiegshürden kann ein Big-Data-Thema schnell mal mit kleinem Einsatz einen kleinen Gewinn bringen und damit die Tür öffnen für den nächstgrößeren Schritt. Schon das Wissen darüber, welche Daten es im Unternehmen überhaupt gibt, liefert einen guten Einstieg, ob in der Produktion oder z. B. in der Analyse von Transaktionsdaten.

MM: Wie sollte Unternehmenslenker vorgehen, wenn die eigenen Ressourcen für diese Aufgaben nicht zur Verfügung stehen?
Held: In diesem Fall kann ein Unternehmen wie die PROFI AG gezielt unterstützen, Engpässe zu überbrücken und mit den unterschiedlichsten Kompetenzen ein Projekt gezielt voranzubringen. Externe Unterstützung ist auch ein Weg, eigene Ressourcen für neue Themen auszubilden. Alternativ können wir Projekte auch komplett als Dienstleistung entwickeln und betreiben.

MM: Welche Anwendungsbereiche versprechen bei möglichst geringem Ressourcen-Einsatz in Sachen Big Data den größtmöglichen Erfolg?
Held: Im Idealfall beginnt man mit einem Thema, für das im Unternehmen Fragestellungen oder Herausforderungen bestehen, und für das bereits eine kleine Datenhistorie aufgebaut ist, seien es Datenlogs von Produktionsanlagen oder eine Transaktionshistorie im kaufmännischen Bereich. Schnelle Ergebnisse lassen sich oft im Erkennen von Mustern in Datenbeständen erreichen. Nach ersten Ergebnissen kann man darauf aufbauen, zusätzliche Sensorik installieren, weitere Stammdaten erheben, um die Auswertemöglichkeiten zu verbessern.

Rainer Huttenloher

PROFI Engineering Systems AG