In den meisten Unternehmen stapeln sich die Daten bis unter die sprichwörtliche Decke. Aus einem solch unübersichtlichen Datenfundus dringend benötigte Dokumente und Informationen manuell herauszufiltern, ist oft eine Herkulesaufgabe. Document Intelligence Tools unterstützen ihre Nutzer dabei und helfen Organisationen, ihre Prozesse zu digitalisieren und zu automatisieren.

Verträge, Rechnungen, Berichte, Präsentationen, E-Mails – die Vielfalt an digitalen Dokumenten, mit der sich Mitarbeitende in Unternehmen täglich konfrontiert sehen, ist groß. Noch größer ist der schiere Umfang des ständig wachsenden Datenschatzes, der sich aus zahlreichen internen wie externen Quellen speist.

So fällt es Mitarbeitenden ohne technische Hilfsmittel zunehmend schwer, in einem vertretbaren Zeitfenster die für ihre Aufgaben wichtigen Dokumente zu finden. Sobald sie dann vorliegen, haben sie in ihnen jedoch noch nicht die relevanten Informationen (sogenannte „Insights“) gefunden und für die Weiterverarbeitung extrahiert. Auch diese Aufgabe frisst wertvolle Bearbeitungszeit und hält Mitarbeitende von wertschöpfenden Aufgaben ab.

Um die wertvollen Insights mit möglichst geringem Aufwand zu erhalten, eignen sich Document-Intelligence-Tools. Darunter versteht man KI-basierte Software zur Informationssuche und Textanalyse, die in der Lage ist, Dokumente zu finden, anzureichern und automatisiert für weitere Workflows zu klassifizieren.

Document Intelligence strukturiert unstrukturierte Daten

Quelle: IntraFind Software AG

Document-Intelligence-Tools analysieren, verschlagworten und klassifizieren Dokumente, zudem reichern sie diese mit Metadaten für die Weiterverarbeitung an.

Angebunden an sämtliche internen und externe Datenquellen eines Unternehmens steigern diese Tools die Effizienz der Mitarbeitenden. Die intelligente Such- und Analysesoftware nutzt künstliche Intelligenz, um beliebige Dokumente und Inhalte zu finden. Solche Tools sind dafür mit einer Vielzahl an Datenformaten und -quellen kompatibel, darunter E-Mails, klassische Office- oder PDF-Dateien, die in unstrukturierter Form vorliegen.

Da in Unternehmen noch viele Dokumente in Papierform vorliegen, sind Document-Intelligence-Tools nicht nur in der Lage digitale Dateien zu analysieren, zu indexieren, zu verschlagworten, mit Metadaten anzureichern und schließlich nach Themen zu klassifizieren. Das gleiche Spektrum an Funktionen lässt sich auch auf gescannte Dokumente anwenden. Durch diese Funktionalität veredelt die intelligente Such- und Analysesoftware unstrukturierte Daten sowie Dokumente zu strukturierten und kontextualisierten Informationen, also zu relevanten Insights.

Unter der Haube schlägt ein KI-Herz

Gute Document Intelligence Tools sind mit Lernalgorithmen ausgestattet. Das Herz der Software bilden KI-Verfahren und -Methoden wie Machine Learning, Deep Learning und spezielle Suchtechnologien, die über ein hohes Maß an Sprachverständnis verfügen. Document Intelligence Tools sind durch Funktionen des Natural Language Processing (NLP) in der Lage, Fragesätze in natürlicher Sprache zu verarbeiten. Ein weiteres besonderes Merkmal ist der Einsatz von Transfer Learning. Nutzer können mit dieser Methode des Deep Learnings bereits vortrainierte neuronale Netze für spezielle Anwendungsfälle mit vergleichsweise kleinen Datensätzen („Small Data“) umschulen.

Das heißeste Eisen im Kontext von künstlicher Intelligenz sind derzeit Large Language Models (LLMs) wie z.B. Luminous von Aleph Alpha oder GPT von OpenAI. Auch Document Intelligence Tools profitieren von dieser Technologie, etwa bei der Themenerkennung gescannter Dokumente. Sie bildet die Grundlage für sogenannte multimodale KI-Modelle, die sowohl Text als auch das Layout eines Dokuments analysieren.

Das ist insofern vorteilhaft, da rein auf Textebene operierende Analysealgorithmen bei Dokumenten mit Tabellen oder in den Text eingebetteten Bildern an ihre Grenzen stoßen und schlechtere Ergebnisse liefern. Dazu gehören vor allem solche, die nicht klassisch von links oben nach rechts unten gelesen werden, sondern sogenannte „Inhaltsinseln“ beinhalten – zum Beispiel Lieferscheine, Rechnungen und Formulare. Multimodale KI-Modelle sind hingegen in der Lage, auch diese sogenannten nichtlinearen Dokumente präzise zu verarbeiten.

Workflows digitalisieren, optimieren und automatisieren

Document-Intelligence-Tools sorgen nicht nur für Ordnung und helfen beim Finden relevanter Informationen, sie helfen Organisationen auch dabei, ihre Prozesse zu optimieren. Ein praktisches Beispiel ist der Einsatz von intelligenter Such- und Analysesoftware in einem Bürgerportal: Ein Document-Intelligence-Tool mit entsprechend trainierter KI kann Antragsunterlagen automatisiert auf Plausibilität, formale Korrektheit und Vollständigkeit prüfen.

Ohne menschliches Eingreifen erhalten Antragssteller bereits während der Dateneingabe Hinweise darauf, ob sie ihre Unterlagen und Angaben korrigieren oder ergänzen müssen. Diese Funktionalität ist nicht nur auf Behörden beschränkt, sondern eignet sich auch für zahlreiche Anwendungsszenarien im unternehmerischen Kontext, etwa zur Optimierung des Workflows im Kundensupport.

Intelligente Such- und Analysesoftware hilft Unternehmen zudem dabei, die immer komplexer werdenden Compliance-Anforderungen zu erfüllen. Nach DSGVO können Kunden von Unternehmen beispielsweise jederzeit die Löschung personenbezogener Daten verlangen. Um hohe Bußgelder durch dahingehende Versäumnisse zu vermeiden, finden Document Intelligence Tools sie auf Knopfdruck aus sämtlichen, der Organisation zugänglichen Quellen und die relevanten Daten können nachgelagert gelöscht werden.

Ein weiterer spannender Anwendungsfall sind die Plausibilitätsprüfung von Verträgen und das Mail-Routing. Bei Letzterem verknüpfen Unternehmen und Behörden ein Document-Intelligence-Tool mit einem zentralen E-Mail-Postfach. Die Software analysiert die eingehenden Mails, sortiert sie nach Inhalten und leitet sie automatisiert an die zuständigen Ansprechpartner weiter.

Ein wichtiger Aspekt von intelligenter Such- und Analysesoftware ist, dass Unternehmen und Behörden jederzeit die Hoheit über ihre Daten haben. Auch die automatisch generierten Metadaten, mit denen die Software Dateien und Dokumente versieht, lassen sich manuell feinjustieren, sollte dafür Bedarf bestehen. Auf diese Weise ist sichergestellt, dass keine ungewünschten Nebeneffekte auftreten und das Document-Intelligence-Tool der Wahl exakt den Ansprüchen gerecht wird, die die jeweilige Organisation an die Software hat.

Franz Kögl ist Vorstand bei IntraFind in München, einem Spezialisten für Enterprise Search und KI.

IntraFind Software AG