Generative KI (GenAI) verändert die Art und Weise, wie Unternehmen mit Daten arbeiten. Modelle wie ChatGPT und LLama generieren Texte, Code und Bilder und automatisieren Dokumentationen. Daher werden sie oft als Effizienzbooster gehandelt. Doch nicht immer sind sie die beste Wahl. Denn während GenAI in einigen Bereichen die Effizienz steigert, kann sie in anderen Bereichen Arbeitsabläufe unnötig verkomplizieren, weswegen klassische Data-Science-Methoden hier sinnvoller sind. – Ein Beitrag von Rosaria Silipo, VP Data Science Evanglism bei KNIME.
Bei der Datenarbeit eignet sich GenAI besonders für Aufgaben, die ohne KI-basierte Unterstützung sehr aufwändig wären, wie beispielsweise bei der Sentiment-Analyse. Hier benötigt man den geeigneten Datensatz, muss ein neuronales Netzwerk bauen, das Modell trainieren etc. Mit GenAI werden viele dieser Schritte abgekürzt.
Doch technische Effizienz allein reicht nicht aus, um eine Technologie zur bevorzugten Wahl zu machen. Oft geht es um einen Kompromiss zwischen Automatisierung und der Qualität der Ergebnisse. GenAI sollte daher nicht als Standardlösung, sondern vielmehr als gezielt eingesetztes, strategisches Tool betrachtet werden. Unternehmen, die den Einsatz von GenAI in datengetriebenen Prozessen evaluieren, sollten daher insbesondere folgende Kriterien prüfen:
Sind Abweichungen in der Genauigkeit tolerierbar?
GenAI kann in vielen Bereichen beeindruckende Resultate erzielen, doch die Verlässlichkeit großer Sprachmodelle (LLMs) ist nicht immer gleichbleibend. Erfordert ein Projekt die Analyse strukturierter Daten und präzise, konsistente Ergebnisse – etwa zur Vorhersage von Maschinenausfällen in der Produktion – können klassische Data-Science-Methoden wie Regressionsmodelle oft genauere Prognosen liefern. Wenn höchste Genauigkeit gefragt ist, sollte die Leistung von GenAI daher stets im Vergleich zu etablierten Methoden sorgfältig bewertet werden.
Kann Transparenz und Nachvollziehbarkeit sichergestellt werden?
Ein großer Nachteil von GenAI ist die fehlende Transparenz. In Projekten, die Rechenschaftspflicht und Nachvollziehbarkeit erfordern – etwa in der medizinischen Diagnostik oder bei Kredit-Scoring-Modellen –, ist die Verständlichkeit der Ergebnisse von zentraler Bedeutung. Klassische Methoden wie Random Forest, Support Vector Machines, Entscheidungsbäume oder lineare Regression bieten daher in solchen Fällen häufig eine bessere Alternative, da sie eine höhere Erklärbarkeit der Ergebnisse ermöglichen.
Bietet GenAI ausreichende Steuerungsoptionen?
Herkömmliche Data-Science-Techniken bieten klare Parameter, um das Verhalten eines Algorithmus gezielt zu steuern. Beispielsweise kann das Erhöhen eines Schwellenwerts die Anzahl der Ausreißer reduzieren, während das Hinzufügen weiterer Bäume in einem Random Forest Modell in der Regel die Zuverlässigkeit der Ergebnisse verbessert. Im Gegensatz dazu verfügen GenAI-Modelle nur über begrenzte Parameter zur Steuerung von Ausgängen, wie beispielsweise die Anpassung der Eingabeaufforderung. Prompt Engineering bleibt jedoch intransparent, da selbst kleine Änderungen an der Eingabe zu unerwarteten und schwer erklärbaren Abweichungen in der Ausgabe führen können. Da Kontrolle und Transparenz eng miteinander verknüpft sind, eignen sich für Projekte, die eine nachvollziehbare Implementierung der Algorithmen erfordern, oft klassische Methoden besser, wenn diese eine direktere Kontrolle bieten.
In welchem Verhältnis stehen Kosten und Mehrwert?
Der Einsatz von GenAI kann teuer sein – sei es durch Lizenzgebühren für proprietäre Modelle oder den erheblichen Ressourcenaufwand für die Datenaufbereitung und Feinjustierung. Zudem zeigt sich in der Praxis, dass viele GenAI-Projekte nach der Konzeptphase scheitern, weil die erwarteten Effizienzgewinne ausbleiben oder der wirtschaftliche Nutzen nicht klar erkennbar ist. Wenn eine klassische Lösung mit geringerem Aufwand die gleichen Ergebnisse liefern kann, ist sie oft die klügere Wahl.
Ein Beispiel aus der Praxis: Wie Unternehmen den Einsatz von GenAI strategisch abwägen sollten
Ein Einzelhändler möchte sein Kundenfeedback kategorisieren. In diesem Fall eignet sich GenAI dank seiner Fähigkeit, natürliche Sprache zu verstehen und zu verarbeiten, hervorragend zur Klassifizierung von Inhalten in Themen oder Stimmungen (positives oder negatives Feedback). In diesem Fall sind leichte Abweichungen in der Genauigkeit akzeptabel. Die Transparenz hinsichtlich der Ergebnisfindung ist kein entscheidender Faktor und die Ergebnisse lassen sich mit vergleichsweise einfachen Anpassungen der Eingabeaufforderungen steuern. Die Automatisierung dieses Prozesses spart Zeit und Ressourcen und überwiegt damit potenzielle Risiken sowie die Kosten.
Anders sieht es aus, wenn derselbe Einzelhändler seine Kunden segmentieren oder Betrugsfälle identifizieren möchte. In diesen Szenarien ist hohe Präzision erforderlich, und selbst kleine Abweichungen können zu fehlerhaften Ergebnissen führen. Zudem bleibt die Arbeitsweise von GenAI-gestützten Analysen oft undurchsichtig. Klassische Machine-Learning-Methoden wie Cluster-Algorithmen oder Anomalieerkennung sind hier meist die bessere Wahl, da sie kontrollierbare und überprüfbare Ergebnisse liefern.
Fazit
Zusammenfassend lässt sich sagen, dass GenAI einen validen Ansatz für viele Anwendungsfälle der Datenwissenschaft bietet. Doch sie ist keine universelle Lösung. In vielen Fällen sind klassische Methoden präziser, transparenter und kosteneffizienter. Unternehmen sollten GenAI daher strategisch einsetzen – immer mit einem kritischen Blick darauf, ob sie für die jeweilige Anwendung wirklich die beste Wahl ist.
Quelle: KNIME
