Mit jedem neuen Jahr gibt es Prognosen, die noch mehr von etwas vorhersagen. Im Jahr 2024 wird es mehr KI, mehr Cloud, mehr Cyber-Angriffe, mehr Einsatz dieser oder jener Technologie geben. Mehr, mehr, mehr. Doch wie wäre es, wenn wir uns nächstes Jahr auf „weniger“ konzentrieren?

Billige Server- und Speicherkapazitäten, der zunehmende Einsatz von Hybrid-Clouds und das exponentielle Wachstum von KI führen dazu, dass die Datenmengen in gefährlicher Weise außer Kontrolle geraten. Das Datenvolumen wächst bereits in mehr als der Hälfte aller Unternehmen um durchschnittlich 50 Prozent pro Jahr.

All diese Daten benötigen Strom, KI sogar noch deutlich größere Mengen. ChatGPT zum Beispiel verbraucht bis zu zehnmal mehr Strom als eine Standard-Datensuche. Gleichzeitig steigt die Effizienz der Rechenzentren (PUE) zwar, kann den Anstieg der Arbeitslast dadurch jedoch bei weitem nicht ausgleichen.

Bis 2030 werden wir allein in Europa 250 Prozent mehr Wasser und 378 Prozent mehr Energie durch unseren Datenkonsum verbrauchen – bis dahin sind es nur noch acht Jahre. Wir wissen, dass wir uns inmitten einer Klimakrise befinden, dennoch sind die Bemühungen von Unternehmen und IT-Branche längst nicht ausreichend, um die Datenmengen und damit den Wasser- und Energieverbrauch zu reduzieren.

Effizienz und Management allein lösen nicht das Problem, dass wir einfach zu viel von allem und zu lange speichern. Wären Daten Papier, wären wir längst unter einem Berg von Daten begraben. Aber sie sind aus den Augen und damit auch aus dem Sinn.

Unternehmen sollten das neue Jahr daher mit dem Vorsatz beginnen, eine „Datendiät“ zu machen, „Fett“ zu reduzieren sowie gleichzeitig die Compliance-Vorschriften in Bezug auf Daten besser einzuhalten. Die Möglichkeiten dafür sind vorhanden und bestehen aus einer Kombination neuer und herkömmlicher Ansätze:

  • KI nutzen, um Daten nach ihrem Inhalt und Wert für das Unternehmen zu indizieren und zu klassifizieren. Die meisten Firmen haben ihre Infrastruktur mit unstrukturierten „dunklen“ Daten vollgestopft, bei denen sie im Schnitt 70 Prozent des Inhalts überhaupt nicht kennen. Katzenvideos sind darin ebenso zu finden wie die Speisekarte der letzten Weihnachtsfeier, Kopien von Datenbanken oder Forschungsergebnisse. KI und maschinelles Lernen können hier massiv helfen und durch die automatische Klassifizierung von Unternehmensdaten eines der komplexesten Probleme entschärfen. Vordefinierte Filter fischen sofort Compliance-relevante Daten wie Kreditkarten oder andere persönliche Daten aus dem Datenpool und markieren sie. Und je länger sie arbeitet und je mehr Unternehmensdaten sie untersucht, desto genauer werden ihre Ergebnisse. Unternehmen werden in die Lage versetzt, automatisch veraltete, verwaiste und redundante Daten zu identifizieren, die sofort gelöscht werden könnten.
  • Konsolidieren der Daten auf einer einheitlichen Plattform, anstatt Dutzende oder gar Hunderte von Silos zu betreiben. Dort lassen sich die Daten mit Standardtechniken wie Deduplizierung und Komprimierung weiter reduzieren. Nach einer Analyse der Enterprise Strategy Group mit mehr als 3.000 Cohesity Kunden vom Dezember 2022 erreichten 89 Prozent eine Datenreduktion von mindestens 96x, wobei viele noch deutlich höhere Reduktionsraten erzielten.

Ein solcher Ansatz ermöglicht eine gezielte Datenlöschung, die qualitative und quantitative Anforderungen erfüllt. Unternehmen bewahren nur die Daten auf, die sie aufbewahren müssen, und auch nur für den vorgeschriebenen Zeitraum. Anschließend löschen sie diese automatisch. So verringern sie Datenberge und wenn sie beispielsweise Opfer eines Cyber-Angriffs werden, wissen sie besser, was kompromittiert, verschlüsselt oder entwendet wurde. Gleichzeitig trägt eine höhere Datenqualität dazu bei, dass KI-Technologien wie Machine Learning oder Large Language Modells (LLMs) auf solider Basis agieren.

Mark Molyneux ist Chief Technology Officer für die Region EMEA bei Cohesity.

Cohesity