Във връзка със зачестилите загуби на данни поради криптовируси, сривове в остаряла компютърна техника и други фактори, напоследък обръщаме особено внимание на важността на архивирането като част от всички ИТ дейности и процеси за бизнесите и организациите.
Когато става дума за архивиране и възстановяване има някои важни термини, определения и функционалности на архивиращите софтуери, с които трябва да се запознаете преди да направите своя избор. Всеки от използваните днес видове и методи на архивиране има предимства и недостатъци като трябва да бъде избран най-подходящият за всеки конкретен случай, след консултация със специалисти по архивиране и възстановяване на данните.
Видове архивиране
Неструктурирано архивиране
Неструктурираното архивиране в най-ниско ниво на архивиране на отделни папки и файлове, без специална организация и последователност на действията, като изисква задължителна човешка намеса през цялото време. При евентуална загуба на данни по някаква причина, не е сигурно, че в архивите ще бъдат открити стари работещи копия точно на търсените данни за възстановяване, за да бъдат използваеми.
Системно архивиране
Системното архивиране е архивиране само на дисковия дял за зареждане (boot) и дяла на операционната система, заедно с инсталираните приложения в него. Такова архивиране е подходящо, ако всичките работни данни в системата (документи, бази данни, имейли, изборажения и др.) се съхраняват на отделен файлов сървър, който има отделно архивиране. Системното архивиране е полезно за бързо възстановяване в работен режим на система, при която е настъпил срив заради хардуерен или софтуерен проблем.
Пълно архивиране
Пълното запазва както системните дискови дялове, така и всички други дялове, които съдържат потребителски данни. Информацията се съхранява под формата на дискови изображения (images), от които могат да бъдат възстановявани целите дялове, но също така и отделни папки или файлове.
Диференциално архивиране
Диференциалното архивиране (архивиране на различията) позволява създаване на едно основно архивно изображение на диск, дисков дял, папки и файлове, след което се правят нови архиви само за разликата в системата спрямо основното изображение. Предимството на този метод е, че ако променяте малко на брой файлове, той ви спестява правенето на пълен архив на системата всеки път и можете да възстановите всичко само от само две изображения – основното и различното (това с последните различни данни след основното). Недостатъкът е, че след време, ако има много нови и променяни файлове спрямо основният архив, те ще се архивират отново и отново и диференциалните архиви могат да станат много големи.
Инкрементално архивиране
При инкременталното архивиране (архивиране с добавяне) се прави един основен архив, а следващите архиви съдържат само новите и променени файлове спрямо последния архив, а не само спрямо основния архив както при диференциалното архивиране. Предимството на този метод е, че спестява много дисково пространство, тъй като не съхранява повече от един път стари файлове, но добавя в новите архиви само новите и променените файлове. Недостатък е, че трябва да се пазят всички архиви след основния, защото за възстановяването на състоянието в определен момент се изисква основния архив заедно с всички предходни архиви до момента на възстановяване.
Постоянно архивиране
При постоянно архивиране се следи за възникнали промени в системата и те веднага се отразяват в архив. Предимството на този метод е, че системата може да бъде върната до най-скорошното текущо състояние преди повредата, буквално до секунди преди срива или загубата. Недостатъкът му е, че заради постоянното следене на промените и съхраняването им се ползват много системни и мрежови ресурси и много повече архивно пространство за запис на всички промени.
Огледално архивиране
При огледалното архивиране се създават едно или повече огледални еднакви копия на цялата система на друго място (в облака или на друг физически или виртуален сървър) и всички възникнали промени в основната система се отразяват веднага във всички огледални системи като при нужда, след констатиране на повреда, профилактика или друга причина, цялата дейност с основната система може да бъде незабавно пренасочена към огледалната такава, без да се губи време за възстановяване. Този метод е сравнително по-скъп и е подходящ за бизнеси с критични системи, които не трябва да прекъсват дори за секунди или минути.
Медии за архивиране
Архивирането на данни може да бъде извършвано върху различни медии като магнитни ленти, твърди дискове, оптични дискове, SSD памети и дискове, дискети или отдалечено чрез ползване на външни облачни услуги в центрове за данни. През последните години се наблюдава често преминаване към изцяло облачно архивиране или комбинирано ползване на локални сървъри и облачни такива (на отдалечено място) за по-голямо подсигуряване на данните срещу загуба и по-бързо възстановяване. Предимството на облачните услуги за архивиране е, че са по-надеждни, защото съхраняват данните на различни места по няколко пъти, и са по-евтини, защото не изискват специален персонал за поддръжката им на място при клиента. Недостатъците им са, че прехвърлянето на големи архиви отнема много време и затова архивирането и възстановяването на данните става бавно, а също и евентуалните рискове за изтичане на данни при хакерски атаки, което обаче може да бъде предотвратено лесно чрез криптиране на всички архиви преди изпращането им в облака.
Избор на метод за архивиране
Когато се говори практично прилагане на определен метод за архивиране, винаги се търси балансът между полезността за бизнеса, цената на архивиране и разумното ползване на системните ресурси. За целта първоначално е необходимо да се определят някои важни параметри на архивирането, които да са подходящи и достъпни за прилагане:
- Целевата точка на възстановяване (Recovery point objective – RPO) се нарича моментът на възстановяване, към който искате да върнете данните от архива. Идеалният вариант обикновено е да могат да се възстановят данните в състоянието им от всеки момент преди повреждането или загубата им.
- Целевото време за възстановяване (Recovery time objective – RTO) е периодът от време, за който искате данните да бъдат напълно възстановени до работното им състояние.
- Количеството на архивираните данни е важно да се предвиди, за да се използват подходящи характеристики на софтуера и да се избере подходящ формат на компресия/compression (намаляване размера на архивираните данни чрез програмни методи за свиването им за спестяване на място) и дедупликация/deduplication (избягване на повторно архивиране на еднакви данни от различни системи).
- Сигурността на данните също задължително трябва да бъде взета предвид при съхраняването им в архиви. Дали архивите ще бъдат съхранени с криптиране (encryption) и с каква сложност се определя според заплахата за неупълномощеното им използване в случай, че те попаднат в неподходящи ръце.
- Времето за задържане на данните (Data retention period – DRP) е периодът от време, за което трябва да съхранявате данните в архивите си, за да сте сигурни, че винаги можете да разчитате на възстановяването им при нужда, но също така и да не правите ненужни разходи за съхраняването им, ако никога няма да бъдат използвани.
Не чакайте да изгубите ценни данни, за да вземете мерки!
Въпреки че редовното и подходящо архивиране на данни е логична стъпка за всеки бизнес, то често е пропускано, омаловажавано или неправилно приложено на практика, което може да доведе до сериозни проблеми с данните на бизнеса и съответно със сигурността и производителността. Архивирането и възстановяването на данни след бедствия е изключително важен проблем, за който има създадени достатъчно софтуерни продукти и услуги, които постоянно се развиват и подобряват. Методите за архивиране, възстановяване, компресиране, криптиране, трансфериране и т.н. са много и преди да подходите към избор на софтуерно решение, е препоръчително да се обърнете към специалисти по архивиране и възстановяване на данни, които да ви помогнат за правилния избор според структурата и дейността на вашата организация.
Автор: инж. Ивайло Тинчев