Computable 10-01-2013 14:54 | Door Kees Jan Meerman
Als we het over data recovery hebben denken we het liefst aan het gecontroleerd terugzetten van gemaakte back-up data, na bijvoorbeeld een systeemcrash, volgens een zorgvuldig en van te voren opgesteld draaiboek.
We noemen dit simpelweg data recovery of disaster recovery. De it-afdeling kan zich in het algemeen, en dat zal bij professionele bedrijven zeker het geval zijn, heel goed voorbereiden op dergelijke eventuele situaties. De ‘data recovery of de disaster recovery’ waar ik het hier over wil hebben gaat echter over iets anders. Het gaat hier over situaties waar we ons niet met (nog meer)it-systemen op kunnen voorbereiden.
Voorbeelden: de overdracht van de ene op de andere systeembeheerder is niet goed verlopen, er zijn fouten gemaakt, er zijn dingen vergeten of verzwegen, er is te weinig onderhoud gepleegd, er is verzuimd een back-up te maken, bij het terugzetten van de back-up is iets misgegaan wat niet mis had mogen gaan, er is te veel vertrouwd op de redundancy van raidsystemen of san’s, et cetera.
Maar denk ook aan fouten die meer aan de kant van het management liggen: nooit uitgevoerde risico analyses, geen budget vrijgemaakt voor disaster recovery planning, het document voor bedrijfscontinuiteit dat nog steeds in de la ligt, geen echte interesse voor alles wat zich in de ‘it-kelder’ afspeelt, het kennisniveau van de it-medewerkers matcht niet meer met de laatste ‘stand van de techniek’. Denk aan virtualisatie. Het gaat in alle gevallen over menselijke fouten. Heel vaak verwijtbare fouten. Maar ook vermeende menselijke fouten zoals het niet hebben van de juiste kennis en kunde.
Ook wordt vaak geconstateerd dat het management te laat of helemaal niet op de hoogte wordt gebracht van storingen en/of incidenten. Ook niet als diezelfde storingen en/of incidenten potentiële bedrijfsrampen zijn. De oorzaak is dat het bij dit soort type incidenten/storingen om menselijke fouten gaat. Verwijtbare fouten. Al dan niet terecht verwijtbaar, maar er speelt een schuldvraag. Deze incidenten en problemen probeert men uiteraard zo lang mogelijk op eigen niveau op te lossen. Proberen om de ramp terug te brengen tot een storing. Men houdt het liever even voor zichzelf of binnen de afdeling. Alles beter dan een discussie aan te moeten gaan over de schuldvraag.
Dit kost een heleboel tijd die er niet is en maakt het probleem in veel gevallen groter en soms zelfs catastrofaal. En de oplossing verder weg. Bij disaster recovery moet juist worden samengewerkt, open kaart gespeeld, en snel geschakeld. Het gaat niet om de schuldvraag, maar om de oplossing.
Het gaat er, als het spannend wordt, niet meer om hoeveel it-systemen we hebben, maar in hoeverre we kunnen samenwerken en snel en transparant kunnen handelen. Oók met hulptroepen van buiten af. En juist als een dergelijke situatie zich voordoet is het zaak dat men weet wat er te doen staat. En dat men zulke hulptroepen kent. Het is dan geen schande om niet alle specialistische kennis in eigen huis te hebben of om fouten gemaakt te hebben. Voor bijzonder complexe problemen zoals raid- en VMWare-recoveries zijn zeer bedreven specialisten beschikbaar. Die specialisten kunnen veel meer voor elkaar krijgen als zij in een zo vroeg mogelijk stadium bij het ‘incident’ betrokken worden.
Data recovery specialisten kunnen een zeer goede aanvulling zijn op je eigen team. Al is het maar om precies te weten waar jouw kennis ophoudt en die van hen begint.
Ga eens kennis maken, zodat het hele team weet wat hen (niet) te doen staat als het zover komt!