E-Mail Archivierung (Teil 1): PST-Dateien und die Exchange-Archivfunktion

Von unserem Mitarbeiter Rainer Sommer
In der Vergangenheit bedeutete E-Mail-Archivierung meist, dass ältere Mails in sogenannte PST-Dateien ausgelagert wurden. Anwender verschoben Mails – auf freiwilliger Basis oder weil Mailboxlimits erreicht wurden – in PST-Dateien. Manche Anwender verwenden mehrere solcher PST-Dateien, in die sie z.B. jeweils die Mails eines gesamten Jahrgangs verschieben. Werden die PST-Dateien auf dem PC oder Notebook abgelegt, besteht die latente Gefahr, dass sie bei einem Festplattendefekt verloren gehen. Eine Speicherung von PST-Dateien in Netzwerk-Shares ist nicht unüblich, kann allerdings zu Problemen führen und wird deshalb von Microsoft nicht unterstützt (http://blogs.technet.com/b/askperf/archive/2007/01/21/network-stored-pst-files-don-t-do-it.aspx „PST files on a LAN/WAN is an unsupported configuration“). Des Weiteren wird durch das Verschieben von Mails in PST-Dateien die Mail-Datenmenge nicht verringert, sondern nur verlagert. Bei einer Ablage der in Fileshares wird weiterhin Speicherplatz (auf Fileservern) belegt und das Unternehmensbackup belastet.

Diese Probleme hat Microsoft beginnend mit Exchange 2010 adressiert und eine Archivierungsfunktion in Exchange implementiert. Über das Aktivieren der sog. Journaling-Funktion können alle neuen Mails sofort archiviert werden (Sofortarchivierung). Über entsprechende Archivierungsregeln können Mails aus Mailboxen in sogenannte Archivierungs-Mailboxen verschoben werden. Bei diesem Verschiebevorgang wird die Mail aus der Mailbox (d.h. aus der Mailbox-Datenbank) in ein Archiv (d.h. eine Archiv-Datenbank) verschoben. Jeder Exchange-Mailbox kann eine Archivierungs-Mailbox zugeordnet werden, beide Mailboxen werden in aktuellen Outlook-Clients gemeinsam angezeigt.
Diese Exchange-interne Archivierungsfunktionalität wird lizenzmäßig nicht mit der Exchange-Server Lizenz (Standard bzw. Enterprise Edition) abgedeckt, sondern über die Exchange User-Lizenz (User-CAL). Dank dieser User-bezogenen Lizenzierung ist eine pro-User Lizenzierung der Archivfunktion möglich. Für die Nutzung der Archivfunktion benötigt der entsprechende Anwender allerdings eine User Enterprise-CAL, die deutlich teurer ist als eine Standard-CAL.
Aktiv_Archivmailbox
Screenshot: Aktivieren einer Archivmailbox per Exchange-Verwaltungskonsole
Werden Mails archiviert, d.h. manuell oder regelbasierend aus der normalen Mailbox in die Archivmailbox verschoben, verbleibt kein Platzhalter (sogenannter Stub) in der normalen Mailbox; d.h. eine archivierte Mail verschwindet komplett aus der normalen Mailbox. Der Anwender findet archivierte Mails nur noch in seiner Archivmailbox wieder, während er nicht archivierte Mails weiterhin in seiner normalen Mailbox finden und bearbeiten kann. Das ist nicht besonders anwenderfreundliche, wenn man z.B. alle Vorgänge zu einem Kunden oder Projekt in seiner Mailbox finden will.
Besser sind Lösungen, die mit Stubs (Platzhaltern) arbeiten. Damit sind alle – auch die archivierten Mails – weiterhin in der normalen Mailbox vorhanden und der Anwender muss sich nicht umgewöhnen. Eine gesonderte Archivmailbox ist nicht nötig. Fazit: Zusätzliche gesonderte Archivmailboxen erleichtern das E-Mail-Handling nicht.
Ein weiterer wichtiger Gesichtspunkt bei der Archivierung ist die Deduplizierung. Das bedeutet, dass identische Elemente nur einmal im Archiv abgelegt werden. Dies führt zu einer erheblichen Platzersparnis. In manchen Dokumentationen wird dies auch als SIS (Single Instance Storage) bezeichnet. Übrigens gab es eine SIS-Funktionalität bereits im Windows Storage Server 2008 (http://technet.microsoft.com/en-us/library/dd573308(v=ws.10).aspx). Diese Funktionalität wurde auch in den Windows Server 2012 integriert (http://technet.microsoft.com/de-de/library/hh831602.aspx).
Bei der Deduplizierung ermittelt das Archivsystem einen Hash-Wert über das zu speichernde Element (Mail oder Attachment) und prüft dann, ob dieser Hash-Wert in der SQL-Datenbank bereits enthalten ist. Ist der Hash bereits enthalten, erfolgt ein byteweiser Vergleich des bereits archivierten Elements und des neuen Elements. Nur wenn beide Versionen identisch sind, wird das neue Element nicht im Archiv abgelegt, sondern durch einen Stub ersetzt, der auf das bereits vorhandene identische Element zeigt.
Ältere Microsoft Exchange-Versionen beherrschten die Deduplizierung noch, aber aus bestimmten Gründen entfiel diese Funktionalität in den neueren Exchange-Versionen (siehe auch „Where’s My Single Instance?“ http://blogs.technet.com/b/exchange/archive/2010/02/22/3409361.aspx). In Exchange 2007 wurde SIS nur noch für Mail-Attachments eingesetzt, die Mails selbst wurden nicht mehr dedupliziert. In Exchange 2010 entfiel dann auch noch die Deduplizierung der Mail-Attachments. Die Gründe hierfür lagen in der Umgestaltung der Datenbanktabellen – hier wurde der Schwerpunkt auf der Verringerung von I/O-Zugriffen gelegt, was wiederum mehr Mailboxen pro Exchange-Server ermöglicht. Durch fallende Storage-Kosten war zudem der Speicherplatzbedarf nicht mehr so wichtig, und der Einsatz von immer mehr Mailbox-Datenbanken erschwerte die Deduplizierung (Exchange Server 2010 and Single Instance Storage: http://www.slipstick.com/exchange/2010-exs/exchange-2010-single-instance-storage/).

IOPS

Schaubild zur IOPS-Reduktion seit Exchange 2003

Leider hat Microsoft auch für die Archivierungs-Datenbanken keine Deduplizierung implementiert, was den unschönen Effekt hat, dass mit der Archivierung keinerlei Platzersparnis erzielt werden kann. Und es kommt noch schlimmer: durch das Aktivieren des Journalings (Sofortarchivierung) wird eine Kopie aller gesendeten oder empfangenen Mails an die Journal-Mailbox gesandt, d.h. jede Mail wird durch diesen Vorgang verdoppelt. Ohne Deduplizierung ergibt sich dadurch auch eine Verdoppelung des entstehenden Mailvolumens, d.h. der Platzbedarf steigt mit Journaling und der Exchange Archivierungslösung drastisch an. Wird beispielsweise eine Mail mit 1 MB Attachment an 10 Kollegen versandt, werden ohne die Exchange-Archivierung etwa 11 MB in den Exchange 2010 Mailbox-Datenbanken abgespeichert. Mit aktivierter Journalingfunktion verdoppelt sich der Speicherbedarf (auf 22 MB). Mit Deduplizierung könnte dieser Speicherbedarf auf etwa 1 MB begrenzt werden. 1 MB vs. 22 MB – das sind gewaltige Unterschiede. Günstig wäre, wenn Microsoft die Deduplizierungs-Funktionalität in zukünftigen Exchange-Versionen wieder bereitstellt (auch in Exchange 2013 ist keine Deduplizierung enthalten).

Die Vorteile der Exchange-internen Archivierungsfunktionalität sind, dass beide Produkte (Exchange und Archiv) von einem Hersteller stammen, die bekannten Verwaltungstools genutzt werden können, und ein Support für beides zuständig ist. Und: Archivmailboxen können auch per OWA angesprochen werden, was mit PST-Dateien nicht möglich war. Die Exchange Archivierung ist in erster Linie dazu gedacht, den Microsoft-Kunden einen Weg aus dem PST-Chaos zu bieten. Dazu sollen die vorhandenen PST-Dateien wieder in Exchange zurückgeführt und in speziellen Archivierungs-Datenbanken abgelegt werden. Dadurch entfällt das Managen und Sichern der PST-Dateien, allerdings zu einem hohen Preis.

Eine „kleine“ Platzersparnis hat Microsoft bei Exchange 2010 in Form eines auf Lempel-Ziv 1977 (LZ22) basierten Kompressions-Algorithmus namens „Microsoft Xpress Compression“ (XPRESS) vorgesehen; hierbei wird die E-Mail – genauer gesagt der Header und Text- bzw. HTML-basierte Textkörper – komprimiert; RTF formatierte Mails und Mail-Attachments werden nicht komprimiert. XPRESS wird auch für viele andere Microsoft-Funktionen eingesetzt, z.B. zur Kompression der Active Directory Replikation oder die DFS-Replikation.

Mit Exchange 2013 hat Microsoft die Archivfunktion überarbeitet und erweitert, aber ohne Wesentliches zu verändern. E-Mails können nun nicht nur in der Archiv-Mailbox sondern auch in der „normalen“ Mailbox vor dem Löschen bewahrt werden. Die eDiscovery Multi-Mailboxsuche kopiert und liefert nun die Resultate nicht mehr in einer spezifischen Discovery-Mailbox, sondern über eine Live-Ergebnisliste. Cross-Produkt-Suchen (ausgeführt vom SharePoint 2013 Server) sind nun möglich und liefern Ergebnisse aus Exchange Server 2013, aus Lync Server 2013 und vom SharePoint Server 2013 – bei dieser Suche werden doppelte Ergebnisse automatisch ausgeblendet. Des Weiteren wurde ein neues Compliance-Archiv eingeführt, sowie eine neue Suchindex-Engine implementiert. Eine Suche in OWA durchsucht nun nicht mehr nur die normale Mailbox sondern auch die Archivmailbox.

Microsoft ist in den Archivierungs-„Markt“ relativ spät eingestiegen, adressiert hauptsächlich die Ablösung von PST-Dateien und wird das Produkt weiterentwickeln, aber es gibt bereits jetzt Archivlösungs-Alternativen die deutlich mehr können, die keine Speicherplatzvergrößerung, sondern eine große Speicherplatzersparnis bieten, und insgesamt deutlich ausgereifter wirken. In Teil 2 dieses Blogs (E-Mail Archivierung: Kriterien eines Enterprise-Archivsystems) werden die Kriterien für eine Enterprise-Archivierungslösung aufgezeigt und in Teil 3 (E-Mail Archivierung: Metalogix Enterprise-Archivsystem) wird am Beispiel eines Metalogix-Archivsystems erläutert, weshalb sich eine professionelle Enterprise-Archivierungslösung lohnt.

Microsoft Exchange Archivlösung – Zusammenfassung:

+        Ermöglicht das Eliminieren von PST-Dateien und Wiedereinbinden dieser Daten in das Exchange-System

+        Keine Installation eines gesonderten Archivsystems nötig

+        Von Exchange gewohnte Managementtools verwendbar

+        Rechtssichere Archivierung konfigurierbar

–        Fehlende Deduplizierung bedeutet hoher Storagebedarf

–        Sofortarchivierung (Journaling) kopiert die Mails und verdoppelt den Speicherbedarf

–        Keine Entlastung des Backups, da sich der zu sichernde Datenbestand deutlich erhöht

–        Relativ teure Lösung (Enterprise User-CALs) für die gebotenen Features

–        Keine Stub-Technologie, d.h. Mails verschwinden beim Archivieren komplett aus der normalen Mailbox

–        Anwender muss 2 Mailboxen managen und findet Ordnerinhalte teils in der normalen Mailbox und teils in der Archivmailbox

–        Für den Archivzugriff aus Outlook 2007 ist ein spezielles AddIn notwendig (ab Outlook 2010 funktioniert der Zugriff ohne das spezielle AddIn), Outlook 2003 unterstützt das Exchange-Archiv nicht.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s