CSSKEN


Název:E-MAIL DO KOŠE, NEBO DO ARCHIVU?
Autor: David Čečelský
Publikováno: Connect!


Klíčová kritéria pro výběr archivace e-mailů

Elektronická pošta se postupně změnila v úložiště velice důležitých obchodních informací a patří dnes bezesporu ke kritickým aplikacím většiny společností. Prognózy některých analytiků tvrdí, že v blízké budoucnosti bude běžná velikost e-mailové zprávy kolem 50-100 MB! Tento nárůst velikosti poštovních zpráv s sebou ovšem nutně přináší i některé významné problémy. Jedním z nich je archivace.

Problémy jsou spojeny především se správou poštovních serverů, které jsou neúměrně přetěžovány, obsahují velké objemy dat, které se obtížně zálohují a archivují. Administrátoři tráví mnoho času nastavováním jednotlivých politik pro uživatele, aby udrželi velikost jejich poštovních schránek na únosné míře.
Nezbývá tedy než hledat nějaké vhodné řešení, které nám pomůže expandující e-mailové systémy ukočírovat. Výrobci soft waru samozřejmě na tuto situaci reagují a na trhu se objevuje celá řada produktů pro archivaci elektronické pošty, pro kešování a ukládání poštovních příloh mimo poštovní server, systémy pro vyhledávání duplicitních dat v e-mailu a jejich odstranění apod.

Zvláštnosti archivace elektronické pošty
Situace s archivací elektronické pošty je velmi podobná, jako u archivace běžných souborů, ale má i svoje specifi cké požadavky. Pokud bychom totiž ponechali ukládání e-mailů na pásky současně s běžnými zálohami, pak bychom asi neuspěli. Představme si, že hledáme např. po třech letech určitou poštovní zprávu v archivech pásek. To by patrně bylo velmi složité a úspěch by pravděpodobně nebyl zaručen. Navíc by to představovalo časově neúnosný a zdlouhavý proces.
Zkusme si tedy popsat základní kritéria systému pro archivaci elektronické pošty.

Takový systém by měl řešit následující:
* zajistit problematiku efektivního a dlouhodobého uložení poštovních zpráv
* zajistit bezpečnost a integritu uložených zpráv
* možnost jednoduchého vyhledávání
* transparentní prostředí pro uživatele (jednoduchost funkcí pro vyhledávání bez nutnosti měnit jejich zvyklosti)
* musí být ve shodě se zákonnými normami pro ukládání a obnovu dokumentů.

Výhody nasazení archivačního systému by měly být také v odlehčení práce produkčním poštovním serverům.
Zmínili jsme také funkce pro vyhledávání, což je samozřejmě vlastnost velice zásadní.
Již ve fázi výběru vhodného archivačního řešení bychom měli zvažovat, jaký druh vyhledávání bude pro nás potřebný v rámci archivovaných e-mailů. Zpravidla se hodí fulltextová indexace, umožňující prohledávat jak vlastní předmět zpráv, tak i informace v hlavičce, tělo zprávy a samozřejmě přílohy.

Jak na přílohy
Už byla řeč o tom, že přílohy elektronické pošty představují značné objemy dat, a proto je nutné jim věnovat speciální pozornost. Ideální řešení pro práci s přílohami by mělo umožnit oddělení příloh od vlastní zprávy a její uložení mimo poštovní server. V těle zprávy pak zůstává pouze odkaz na danou přílohu, kterou si uživatel v případě potřeby stáhne kliknutím myši. Výhodou tohoto řešení je i fakt, že při výpadku poštovního serveru způsobeném havárií není nutné provádět obnovu velkých objemů dat. Pochopitelně se podstatně zmenšuje velikost požadovaného zálohovacího okna pro poštovní servery.
Takováto chytrá kešovací zařízení jsou již na trhu k dispozici. Obvykle jde o prvky, které se zapojují v demilitarizované zóně, jsou jednoduše konfigurovatelné a spravovatelné s minimální nutnou údržbou. Vhodným příkladem takového produktu je např. Secure File Transfer Appliance od americké společnosti Accellion - viz. www.accellion.com.
Zajímavou technologii představila v nedávné době izraelská společnost Diligent Technologies. Jedná se o produkt ProtecTIER (informace na adrese www. diligent.com). Jedná se o robustní řešení pro ukládání dat s využitím diskových systémů.
Součástí produktu je velmi unikátní technologie, označovaná jako HyperFactor.
Tato technologie zabraňuje ukládání redundantních dat a významně snižuje velikost potřebné diskové paměti pro zálohovaná data. Samozřejmě umožňuje i vyhledávání duplicitních dat i v e-mailových přílohách.
Vezměme si příklad, kdy si různé dokumenty posíláme poštou, máme je uloženy na souborových systémech, FTP serverech apod. Algoritmy technologie HyperFactor detekují tato data a ukládají unikátní data pouze jednou, na ostatní místa jsou pouze uchovány odkazy. Toto řešení patří již do kategorie enteprise, čemuž odpovídá i jeho cena.
Jinou alternativou řešení pro zvládnutí obřích příloh poštovních zpráv jsou tzv.
virtual staging servery. Jedná se vlastně o službu pro odkládání souborů s možností jejich stahování. Uživatel si udělá registraci této služby a získá možnost odkládání určitého objemu souborů na hostované úložiště - prakticky tedy soubory vystaví místo toho, aby je přiložil k odeslané zprávě jako přílohu. Příjemce zprávy má pak v těle pouze odkaz, pomocí kterého si přílohu zobrazí. Tento systém je sice levnou záležitostí, není však příliš výhodný (nebo spíše pro malé společnosti). Uživatelé totiž nemají kompletní přehled o přílohách a navíc se po nějakém čase k těmto přílohám nedostanou. Důvod je prostý, poskytovatel služby soubory po určité době z úložiště maže.

Co by měl umět archivační systém
Nastínili jsme problematiku archivování elektronické pošty a zmínili jsme i některá kritéria, která by měl archivační systém splňovat. Tato kritéria jsou již částečným vodítkem, které nám pomůže při výběru vhodného soft waru. Před vlastní implementací však musíme zvážit ještě další důležité faktory. Jsou to zejména organizační záležitosti typu:
* jaká data musí být archivována a kde budou fyzicky uložena
* jak budou data členěna do kategorií a jak se bude nastavovat a řídit přístup do jednotlivých kategorií archivovaných dat
* jakou dobu bude vyžadováno, aby data byla archivována
* kdo bude zodpovědný za archivaci a obnovování dat na úrovni jednotlivých kategorií

Z povahy archivovaných dat samozřejmě vyplývá, že politiky pro udržování dat v archivu a řízení přístupu k těmto datům musí být stále udržovány aktuální, neboť jde o velké bezpečnostní riziko.
Máme samozřejmě na mysli neoprávněný přístup k datům a možnosti jejich zneužití.
Tato situace je relativně jednoduchá, pokud se jedná o menší společnost, kde veškerá e-mailová komunikace jde přes jeden poštovní server. Zcela jiná situace je však u nadnárodní společnosti, která má desítky takových serverů po celém světě.
U archivačního soft waru není ani tak kladen důraz na rychlost vlastního archivačního procesu, problémem není ani přerušení procesu apod. Důraz je ovšem kladen na odolnost systému vůči chybám sítě, hardwaru a soft waru, aby byla garantována kompletnost zapsaných dat a tím celá integrita archivu. Samozřejmě by měl disponovat i funkcemi pro vysokou dostupnost (high avalability).
Problémem dnešní komunikace pomocí elektronické pošty jsou také spamy a viry.
Některé statistiky poukazují na to, že asi 70 % místa na poštovním systému zabírá právě spam. Co se týče virů, pak statistiky uvádějí, že asi v 1 zprávě z 25 se nachází virus (červ apod.). Tyto údaje jsou samozřejmě znepokojivé a z hlediska archivačního systému bude každého zákazníka jistě velmi zajímat, zda řešení obsahuje např. funkce pro sledování obsahu (tzv. content filtering). Bylo by jistě velmi neefektivní, kdyby archiv obsahoval ze tří čtvrtin naprosto irelevantní data.
V neposlední řadě by archivační systém měl být schopen nastavovat politiky pro odmazávání dat, u nichž uplyne povinná perioda pro jejich uložení, nebo je nezbytné tato data po nějaké době zničit např. z bezpečnostních důvodů.

Hráči na trhu
Pojďme se nyní podívat na některé konkrétní produkty pro archivaci, které jsou dnes na trhu k dispozici. Mezi významné společnosti, které se zabývají mj. vývojem archivačních nástrojů, patří např. Symantec, IBM, Captaris, Quest Soft ware, OpenText, EMC, ZANTAZ a mnohé další. Někteří výrobci poskytují funkce pro archivaci elektronické pošty jako součást větších řešení pro ECM (Enteprise Content Managemt) a jedná se vesměs o řešení, cílená opravdu do enterprise prostředí. Uveďme například produkty EmailXtender společnosti EMC, Livelink ECM Email archiving system společnosti OpenText apod.
Naše zákazníky v České republice budou samozřejmě zajímat takové produkty, které lze u nás zakoupit například prostřednictvím distribučních firem. Dále je bude zajímat servis a podpora produktu prostřednictvím partnerských firem. Po této stránce bude patrně velmi vyhovovat právě společnost Symantec (která koupila známou „zálohovací" společnost Veritas) se svým produktem Enteprise Vault.
Různí výrobci mají také odlišný přístup k funkcionalitě systému, k jednotlivým funkcím a ovládání. Klíčovou záležitostí je nastavování politik, které automaticky ovládají obsah archivu - tzv. retension policy. Již jsme naznačili, že každá organizace má jistým způsobem definovánu vlastní interní politiku pro to, jaká data a jakým způsobem mají být archivována. Často je tato záležitost určena přímo zákonem. IT oddělení pak dostává za úkol tuto politiku převést do praxe pomocí implementace vhodného produktu. V zásadě může existovat několik přístupů k archivaci elektronické pošty:
* neukládáme nic - data jsou z archivu mazána po definovaném časovém období
* ukládáme pouze vybrané zprávy - v archivu zůstávají pouze data obsahující obchodní či jinak důležité informace
* ukládáme vše - v archivu se kupí veškerá elektronická korespondence

První přístup se zdá být jednoduchou záležitostí.
Nespočívá však pouze ve vyčištění zpráv ze záloh nebo poštovního serveru. Je nutno také vyškolit uživatele, aby totéž prováděli samostatně pomocí svých poštovních klientů, pokud mají poštu uloženou na lokálních discích pracovních stanic nebo jiných sdílených místech souborového systému. Uživatelům by mělo být zakázáno ukládání pošty na jiná média či jejich přesílání na soukromé poštovní schránky.
Druhý přístup vyžaduje klasifikaci dat v poštovních zprávách a jejich dělení do skupin. Kategorizace a indexování je poměrně složitou záležitostí a vyžaduje velmi pečlivou konfi guraci politik, které je budou provádět a následně zprávy přesouvat do archivu.
Poslední přístup - tedy ukládat vše - se zdá jako nejbezpečnější strategie. Pro tuto strategii je potřeba mít k dispozici velmi dobrý antispamový filtr, abychom si nezahltili úložiště nepotřebnými daty. No a rovněž bychom se měli poohlédnout po vhodném diskovém úložišti, nejlépe takovém, které se dobře rozšiřuje.

Jak vybírat
Zde by mohli čtenáři namítnout, že jsme jim rozhodování příliš neulehčili. Skutečně není jednoduché rozhodnout, který produkt je ten pravý pro naši společnost. Uvedli jsme celou řadu kritérií, která by měl tento soft ware splňovat, a jaké přístupy je možné k archivaci zvolit.
Pokud by někoho zajímal nezávislý názor, jak si stojí produkty výše uvedených výrobců v konkurenčním prostředí, uveďme například známý magický kvadrant společnosti Gartner. Poslední se objevil na jaře loňského roku a vedoucí místo zaujímal tehdy ještě Veritas, nyní Symantec, následovaný řešením od EMC.

Graf: Magický kvadrant - zálohování mailserverů
zdroj: Gartner (duben 2005)

O autorovi| David Čečelský, Vystudoval Strojní fakultu VUT v Brně, v IT pracuje od roku 1994. Nyní je zaměstnán ve společnosti Anect jako konzultant předprodejní podpory.

 



Copyright (c) 2007 ANECT a.s. , Praha: +420 271 100 100, Brno: +420 547 100 100, Bratislava: +421 (2) 4821 3111, Přihlášení | Publikační systém Amadeo  Vytiskni stránku