Sistemos atkūrimas po avarijos - tai procesų, taisyklių ir procedūrų visuma, skirta kritiškos organizacijos darbui technologinės infrastruktūros atkūrimo paruošimui ir darbo pratęsimui po gamtos ar žmogaus sukeltų avarijų.
IT infrastruktūrą galima apibrėžti kaip visumą visų reikalingų komponentų, skirtų IT paslaugoms teikti - t.y. serveriai, saugyklos, atsarginio kopijavimo sistemos, tinklai, asmeniniai kompiuteriai ir kt. Visa tai reikia dokumentuoti sistemos atkūrimo avarijos atveju plane.
Į IT sistemos atkūrimą avarijos atveju galima žiūrėti kaip į dalį platesnės srities, vadinamos verslo tęstinumo planavimu, apimančio ir su IT nesusijusius aspektus, pavyzdžiui, svarbiausius darbuotojus, pastatus, elektros tiekimą, ryšį krizės metu ir kt.
Avarijas galima klasifikuoti taip:
- gamtinės nelaimės, pavyzdžiui, gaisras, potvynis, žemės drebėjimas ir kt.
- žmogaus sukeltos nelaimės, pavyzdžiui, techninės avarijos, sabotažas, virusai, įsilaužimas ir kt.
Pastarosios pasitaiko dažniau ir gali būti tyčinės arba netyčinės.
Sistemos atkūrimo po avarijos sprendimai turi būti pagrįsti verslo reikalavimais, o ne techniniais pageidavimais.
Kodėl?
Nors į galvą visų pirma šauna didelio masto nelaimės, tačiau daug labiau tikėtina, kad sistemos veikimą sutrikdys programų klaidos, sistemos sutrikimai, įsibrovėlių atakos bei žmonių klaidos.
Siekiant išlikti konkurencingiems, reikalavimai galimų prastovų laikui yra griežtinami. Keletas pavyzdžių:
- darbas visą parą
- pristatymas be sandėliavimo
- pasaulinis tiekimo tinklas
- greita ir nuolatinė prieiga prie programų
- privalomi teisinės kontrolės reikalavimai
Verslo operacijų tęsimas iškart po sutrikdymo yra būtinas. Idealiu atveju norėtumėte tęsti veiklą nuo to laiko momento, kai sutriko veikimas. Norint pasiekti šį tikslą, naujausi verslo duomenys visada turi būti prieinami saugiai atskirtoje nuo nelaimės srities vietoje.
Projektuojant sistemos atkūrimo po avarijos sprendimą, labai svarbu apsvarstyti
- Atkūrimo taško tikslą (RPO)
- Atkūrimo laiko tikslą (RTO)
- Aptarnavimo lygio sutartį (SLA)
prieš pasirenkant, kurį būdą naudoti.
Terminų apibrėžimus rasite skyriuje Atsarginis kopijavimas ir atkūrimas
Atkūrimo avarijos atveju planavimas
Pirmasis atkūrimo avarijos atveju plano įgyvendinimo žingsnis yra įsisąmoninti, kas organizacijai yra vertingiausia, t. y. susieti taikomąsias programas su jų valdomais verslo procesais. Remdamasi šiais duomenimis organizacija gali nuspręsti, koks yra priimtinas kiekvienos taikomosios programos prastovos laikas.
Žinoma, priklausomybės taip pat labai svarbios – prioritetai tampa technine problema. Įvairios sistemos, pavyzdžiui, sistemos vartotojų registras ir atsarginio kopijavimo bei atkūrimo programos yra aukštesnio prioriteto, jas reikia atkurti prieš atkuriant ką nors kitą.
Techniniai sprendimai
Priklausomai nuo reikalavimų, galima įdiegti įvairius techninius sprendimus:
- Atsarginio kopijavimo ir atkūrimo sistemas
- Replikavimo sistemas
- Klasterius
Galimybė atkurti sistemą avarijos atveju bus praktiškai naudinga tik tada, jei sistema bus sistemiškai ir dažnai išbandoma, kadangi dėl nuolatinių pakeitimų tipiškame duomenų centre avarinės sistemos konfigūracija gali nebeatitikti realios sistemos, gali trūkti reikalingų ryšių ir pan.
Proact
Atkūrimo po avarijos sprendimo apibrėžimas ir projektavimas yra sudėtinga užduotis.
„Proact“ sukaupė daugelio metų patirtį sistemų atkūrimo po avarijos sprendimų projektavimo, diegimo ir aptarnavimo srityje. „Proact“ atstovauja pirmaujančioms technologijoms duomenų saugyklų srityje ir gali padėti klientams priklausomai nuo jų verslo poreikių.