Skip to main content

Dokumenten-Management im Zeitalter des Machine Learning

Am 28.09.2016 habe ich beim IOM Summit in Köln einen Impuls-Vortrag im Expert-Panel „Technologie Trends für den Digital Workplace“ gehalten. Viele Unternehmen sprechen von der Einführung eines Digital Workplace und haben sehr gute Konzepte entwickelt, um Social Collaboration im Unternehmen einzuführen und treiben dies auch voran. Aber nicht alle haben dabei den digitalen Mindset im Blut verinnerlicht und haben im Laufe der Zeit Dokumente gehortet, die es zu bewahren gilt. Diese meistens mehrere TerraByte großen Dateiablagen können nicht mehr so einfach durchforstet und aufgeräumt werden. Die Ordnerstrukturen sind häufig bis zur zweiten Ebene vorgegeben und oft erstaunlich sauber umgesetzt worden. Aber alle Strukturen ab der 3. Ebene abwärts (und es kann wirklich tief verschachtelte Strukturen geben) sind sehr individuell angelegt und für Außenstehende nicht immer klar verständlich.

Auf der einen Seite sind die Inhalte alt und umfangreich und auf der anderen Seite auch viele Kollegen, die diese Dokumente angelegt haben nicht mehr im Unternehmen. Dadurch geht jeder Organisation viel Wissen verloren und die Wissensarbeiter heute müssen sehr viel Zeit für die Suche nach relevanten Informationen aufwenden. In Summe führen solche Dokumenten-Silos zu erhöhtem Recherche-Aufwand, doppelter Arbeit und sogar zu Fehlentscheidungen aufgrund falscher, veralteter oder fehlender Informationen – nicht zu vergessen die Frustration bei den Mitarbeitern.

Was nun? – Machine Learning!!!

Wir haben aus der Not eine Tugend gemacht und durch Einsatz von Machine Learning die Situation optimiert und zukunftssicher gestaltet. Die Leistungsfähigkeit von Computern steigt exponentiell und die Kosten sinken entsprechend. Speicherplatz kostet fast nichts mehr, was zum Dilemma geführt hat, aber auch Rechenkapazität ist extrem im Preis gesunken. Durch die neuen Algorithmen des Machine Learning können neuartige Verfahren eingesetzt werden, um die Dokumenten-Silos wieder sinnvoll nutzbar zu machen.

Next Generation Document Management

Wir haben auf Basis verschiedener OpenSource-Komponenten ein Machine Learning System aufgebaut, welches optimal für den Einsatz im Umfeld von großen Datenmengen und Dokumenten einsetzbar ist. Dabei stellen wir unterschiedliche Adapter bereit, um die notwendigen Dateiformate anzubinden. Über Preprocessing zur Bereinigung der Daten und weiteren Algorithmen werden ihre Dokumente voll automatisch klassifiziert und eingeordnet. OCR führt dazu, das auch Inhalte von gescannten Texten wieder zur Verfügung stehen und genutzt werden können. Das System lernt anhand von individuell vorgegebenen Mustern, welche Eigenschaften ein Dokument hat und wird durch jedes verarbeitete Dokument mit der Zeit automatisch immer besser.

Die Ergebnisse werden optimal im neuen Digital Workplace oder der Social Collaboration Plattform integriert. Und das ist der Clou. Der Endnutzer muss nicht wissen, wo die Daten liegen. Er greift einfach über die optimal klassifizierten Suchergebnisse auf die Information aus dem Dokument zu. Er muss nicht mehr recherchieren, in welchem Dokument die Information gespeichert sein könnte. Der Nutzer gibt nur seinen Suchbegriff ein und bekommt in Bruchteilen von Sekunden Inhalte aus der aktuellen Plattform oder aus dem Dokumenten Archiv vorgeschlagen. Neben der aktiven Suche können Dokumente auch sehr einfach über automatisch generierte Kategorien bzw. Schlagworte (Tag Clouds etc.) gefiltert und auf definierte Themenbereiche eingegrenzt werden. So lassen sich sehr einfach thematische Listen oder Listen von verwandten Dokumenten und Themen erstellen.

Fazit

Im Anschluss an meinen Impuls-Vortrag entstand eine spannende Diskussion über die Möglichkeiten von neuen Technologien. Viele Teilnehmer nahmen die Erkenntnis mit, dass heute schon viel mehr möglich ist als man denkt. Früher war Machine Learning immer ein Begriff aus der Wissenschaft und wurde für den Unternehmenseinsatz als „noch nicht geeignet“ angesehen. Aber inzwischen haben sich die Tools enorm weiterentwickelt und sind einsatzbereit für den massentauglichen Einsatz in Unternehmen.

Machine Learning eröffnet völlig neue Wege im Umgang mit Informationen und Dokumenten. Mit dem Next Generation Document Management haben wir die passende Lösung für Sie. Mit unserer Lösung können wir Ihre Dokumenten-Ablagen wieder sinnvoll aufarbeiten und nutzbar machen – ganz ohne zeitraubenden manuellen Aufwand. Mit modernster Technologie sind Sie zukunftssicher aufgestellt und können die Vorteile des Machine Learning schon jetzt in Ihrem Unternehmen nutzen. Werden Sie als Organisation effizient, agil und nutzen Sie das vorhandene Wissen, um für die disruptiven Anforderungen des Marktes heute und in Zukunft sicher aufgestellt sein.

Kostprobe gewünscht?

Stellen Sie uns einfach einen Teil von relevanten Dokumenten zur Verfügung. Gerne zeigen wir Ihnen in einer Demo, was mit Machine Learning für Ihr Unternehmen möglich ist. Vereinbaren Sie einfach einen Beratungstermin mit uns.

Über den Autor

empulse Team

Unser kompetentes und erfahrenes Team von (Java-)Entwickler ist stark in Beratung, technischer Konzeption und zuverlässiger Umsetzung komplexer Projekte. In unseren Reihen haben wir Spezialisten für unterschiedliche Themengebiete, die hier ihr Fachwissen zum Besten geben.