Unternehmens-IT : Datenarchivierung: Chaostheorie

Es ist wie mit der privaten Festplatte – wie oft schaut man sich denn tatsächlich noch die hunderten und tausenden Urlaubsfotos an, die sich im Laufe der Jahre angesammelt haben? Für die Datenspeicherung im Unternehmensmarkt hat IDC aussagekräftige Zahlen präsentiert: Von der gesamten Datenmenge, die Unternehmen produzieren und verspeichern, werden rund 90 Prozent nie mehr aufgerufen. Und von den restlichen 10 Prozent werden zwei Drittel gerade noch einmal ausgelesen.

Es bleibt also nur ein kleiner Prozentsatz der produzierten Daten, die ein Unternehmen tatsächlich regelmäßig nützt. Speichermedien sind heute geradezu unverschämt günstig. So ist man versucht, mit einem Schulterzucken zu reagieren. Aber über die Datenmengen kommen die Kosten dann doch wieder durch die Hintertür herein. Denn die sind im permanenten Höhenflug. Dazu trägt das Internet der Dinge bei, das aus jeder Bohrmaschine und jedem Lichtschalter einen Datenproduzenten macht.

Und noch schwerer wiegt das Wachstum der unstrukturierten Daten. Präsentationen, Bild und Video, über Mail versandt und so mehrfach kopiert, Textdateien in zig Versionen auf mehreren Rechnern abgespeichert. Der Mitarbeiter ist ein passionierter Jäger und Sammler – von Daten, denn man könnte sie ja nochmal irgendwann mal brauchen. Das Entsorgen nicht mehr benötigter Mails oder veralteter Dokumentenversionen ist ihm dagegen wesensfremd. Abgesehen davon kostet das Zeit, die er tatsächlich besser in produktive Arbeit investieren sollte.VerwirrungAngesichts dieser Datenexplosion sehen nicht wenige ein Comeback von veraltet geglaubten Speichermedien wie dem Tape heraufdräuen, denn billiger geht’s wirklich nicht. Was aber den meisten Unternehmen fehlt, ist eine Strategie für ihre Datenhaltung. Die Probleme beginnen schon mit der Begriffsverwirrung rund um Archiv und Backup. Hier geht´s weiter

Thematiken übrigens, die vielerorts recht salopp gehandhabt werden. „Viele glauben ja, dass jede große Datenansammlung schon ein Archiv ist“, sagt Hans Schramm, der Storage- Spezialist von Dell. Wie sich Backup und Archiv abgrenzen, ist auch nicht jedem klar: „Kann schon passieren, dass man sich eine Zeitlang mit einem Kunden über sein Archiv unterhält, um dann herauszufinden, dass er eigentlich von seinem Backup spricht.“

Kurz, das Backup ist der Rettungsanker nach der IT-Katastrophe, das Archiv ist für Daten gedacht, mit denen man mehr oder weniger regelmäßig arbeitet. Und dann kommt noch das Archiv im klassischen Sinn dazu, das hauptsächlich aus rechtlichen Verpflichtungen heraus benötigt wird – das aber auch nicht jeder hat, der es haben müsste.

Denn das gern mit einem Archiv verwechselte Backup deckt Complianceanforderungen eben nicht ab. Und Revisionssicherheit kann man entgegen den Versprechungen mancher Hersteller auch nicht kaufen. „Die Software ist eine notwendige, aber nicht hinreichende Voraussetzung. Diese Revisionssicherheit ist eine organisatorische Frage, es geht um ein Rahmenwerk aus Richtlinien und Zuständigkeiten, das sicherstellt, dass Daten nicht mehr verändert werden können“, sagt Günter Weick vom E-Mail-Spezialisten SofTrust Consulting.BewegungVolker Gröschl, bei HP Österreich für den Bereich Storage verantwortlich, sieht da einen Nachholbedarf: „Die Unternehmen haben sich in den letzten Jahren sehr auf die Serverkonsolidierung und die Virtualisierung konzentriert, aber man kann das nicht isoliert betrachten – also ohne Netzwerk und Storage.“ Bei HP heißt das Converged Infrastructure und ist Teil eines Markttrends, der den Kunden mehr Flexibilität verspricht.

Denn in den letzten beiden Jahren ist anbieterseitig Bewegung in den Bereich der Datenhaltung gekommen. Wurden bis vor kurzem noch monolithische Storagesysteme verkauft, die alle Daten eines Unternehmens ohne Unterschied auf die aktuell schnellsten verfügbaren Medien speichern, haben die Hersteller mittlerweile auch erkannt, dass nicht alle Unternehmensdaten gleich wichtig sind. Bei Dell nennt man das Fluid by Design: „Damit kann man das primäre Storage, aus dem heraus tagtäglich gearbeitet wird, das auch teuer ist, weil da die schnellste Technologie drinsteckt, schlank halten.“ Zuerst werden die Daten auf den äußersten Rand der schnellsten Festplatten gespeichert, denn dort ist die Lese- und Schreibgeschwindigkeit am höchsten.DatenwanderungUnd dann übernimmt das System das, womit jeder Mensch überfordert wäre: Es bewertet die Bedeutung der gespeicherten Daten, indem es die frisch gespeicherten Datensätze beobachtet, sieht, wie oft darauf zugegriffen wird. Datensätze, die nicht benötigt werden, schreibt es zunächst auf der schnellen Festplatte weiter nach innen und macht so außen Platz für neue Daten. Die nicht benötigten Daten können mit der Zeit weiterwandern, auf eine langsamere Platte oder sogar auf ein Band.

Sollten die Datensätze irgendwann mal wieder häufiger gebraucht werden, etwa wenn ein Projekt wieder aus der Versenkung geholt wird, dann treten die Daten wieder den Weg zurück nach oben, in schnellere Regionen, an. „Es reicht, wenn 15–20 Prozent der Festplatten im Storage schnell sind“, meint Schramm. Und wenn der Speicherbedarf wächst, werden nur langsamere, günstige Platten zugekauft, denn die Datenmenge, mit der ein Unternehmen aktiv arbeitet, bleibt in etwa gleich.

Hier geht´s weiter

Christoph Strnadl von der Software AG hat einen klaren Standpunkt: „Archivierung ist tot. Es gibt noch Lösungen zur Langzeitarchivierung, die in bestimmten Einsatzszenarien Sinn machen – aber die sind eine Ausnahme.“ Sonst hat der Verfall der Speicherplatzpreise dazu geführt, dass ein Dokumentenmanagementsystem die Aufgabe des Archivs gleich mitübernehmen kann.

Trotzdem ist für die meisten Entscheidungsträger das Archiv nach wie vor ein Thema. „Die Unternehmen denken noch immer zu stark in Dokumententypen“, meint Strnadl. Die Entwicklung geht aber hin zu einem Enterprise Content Management System, das alle Dokumententypen verwalten und archivieren kann – und das auch allen rechtlichen Kriterien genügt. „Das Archivierungsthema trägt oft der Wirtschaftsprüfer ins Unternehmen“, sagt Martin Leitner von H&S Heilig und Schubert, „damit das Unternehmen aber über die Erfüllung gesetzlicher Rahmenbedingungen hinaus profitiert, sollte man einen ganzheitlichen Ansatz wählen. Denn das Archiv ist ja nur das Endprodukt der Unternehmensprozesse.“"Mehr als 50 Anbieter"

Leitner rät also zu einem Dokumentenmanagementsystem, das auch die Prozesse, die Daten von ihrer Entstehung bis ins Archiv durchlaufen, bewältigen kann: „Gerade kleine und mittlere Unternehmen sind nicht optimal strukturiert, nicht alle Prozesse werden sauber abgewickelt.“ Maßgeschneiderte Prozessautomatisierung ist teuer, daher bietet H&S vorgefertigte Prozesse von der Stange an, die laut Leitner binnen weniger Tage implementiert sind. Wer dennoch lieber auf eine spezialisierte Archivlösung setzen möchte, wird am Markt sicher fündig. „Denn da tummeln sich allein im Bereich E-Mail-Archivierung mehr als 50 Anbieter, die alle ihre spezifischen Stärken haben“, wie Weick versichert.

Und unterschiedliche Zielsetzungen. So hat auf die einen Lösungen nur der Compliance-Verantwortliche des Unternehmens Zugriff, bei den anderen jeder Mitarbeiter. Der Trend geht eindeutig Richtung mehr Komfort. So sind vor allem Lösungen beliebt, die sich in Outlook integrieren lassen und dadurch eine unendlich große Mailbox vorgaukeln, da man eben direkt über das Mailsystem auf das Archiv zugreifen kann. E-Mail-Archivlösungen (siehe Kasten) gibt es aus der Cloud, als Software und Appliance. Und welche dieser Lösungen zum Unternehmen passt, ist die erste Frage – erst dann kann man sich auf die Suche nach einem Anbieter machen.Christian Stemberger

© Fotolia
© Fotolia
© Fotolia
© Fotolia