Time voor continuïteit

Sinds enkele jaren is continuïteit een populair begrip geworden en wordt het breed besproken in de ICT-wereld. Waar het vroeger eerder op verhaallijnen in films en boeken sloeg is continuïteit door de toenemende afhankelijkheid van ICT nu een belangrijk thema waar iedereen aandacht voor heeft. Door die toenemende afhankelijkheid van ICT wil men namelijk een partij kiezen die garanties op het gebied van continuïteit kan leveren.

Garanties
Datacenters zijn gebouwd om continu te kunnen leveren. Continue stroom, continue koeling en continue beveiliging zorgen ervoor dat de continuïteit van cruciale ICT-ystemen van hun klanten niet in gevaar komt.
Maar hoe goed is nu de partij met wie je in zee wil gaan? Ervaringen, referenties, “spec-sheets” en de eventuele site-tours zeggen uiteraard iets maar zijn ook vaak gekleurd. Certificeringen zijn al beter, maar zijn nog vaak vrij generiek en gaan niet in op de specifieke datacenter en ICT-techniek.

Stand der zaken
Verzekeringsmaatschappijen kijken inmiddels met een schuin oog naar het continuïteitsvraagstuk. Zij zien de ICT-wereld als een nieuwe markt om continuïteitsrisico’s te verzekeren. Maar ze eisen net als accountants duidelijk omschreven standaarden waarnaar je prestaties kunt toetsen.
Daarom is het ook goed dat er nu projecten zoals PEDCA zijn, waarbij een inventarisatie wordt gemaakt van het datacenter-speelveld. Het is een eerste stap naar een meer gedetailleerd toetsen van normeringen.

Hoeveel heb je ervoor over?
Continuïteit heeft zijn prijs. Het kost nu eenmaal meer om extra redundantie qua stroom, verbindingen, architectuur, hardware en locaties in te bouwen. In veel aanbestedingen worden de mooiste en meest uitgebreide eisen gesteld aan de gewenste omgeving. Maar in de eindfase van de uitvraag, als het om geld gaat, wordt vaak de potloodstreep gebruikt. Men schetst een Rolls-Royce maar kan maar een Suzuki betalen.

De gebruiker van IT zou hier bewuster mee om moeten gaan. Wat zijn de gevolgen van een outage? Hoeveel geld verlies je per uur dat je onbereikbaar bent?
Het is vooral van belang geen beloftes te maken die niet reëel zijn of die niet waargemaakt kunnen worden.

Toegift: Dat niet alles een doorlopend verhaal is, is hieronder te lezen. De top 10 van de raarste datacenter outages, dus dis-continuïteit, werd onlangs gepubliceerd op de site Datacenterknowledge:

1 – De schrikkelseconde bug
Een schrikkelseconde is een aanpassing die af en toe wordt toegepast op de UTC (Coordinated Universal Time) om rekening te houden met variaties in de rotatiesnelheid van de aarde. De toevoeging van deze seconde veroorzaakte in 2012 problemen voor een groot aantal ICT-systemen

2 – Knagende eekhoorns
In 2010 zorgden eekhoorns dat de helft van het Santa Clara datacenter van Yahoo down ging door los te gaan op belangrijke kabels.

3 – Datacenterverhuizing
NaviSite verwierf in 2007 een hosting provider genaamd Alabanza en besloot de servers daar te verplaatsen naar hun centrale datacenter. Sites gehost door Alabanza gingen offline gedurende de move van 680 km.

4 – Anker breekt kabel
Zeekabels zorgen voor de dataverbindingen van eiland naar eiland, continent naar continent. Hoewel deze kabels stevig zijn uitgevoerd gaan ze weleens kapot. In 2008 was er een reeks aan incidenten waardoor hele gebieden down gingen (in 2013 ook het eiland Formentera door een anker.

5 – Diefstal
Nianet, een Deense ISP, ging plat toen dieven via een gat in de muur het datacenter binnenkwamen om netwerkkaarten te stelen. Hoe de dieven door de muur kwamen en waarom ze uit waren op netwerkkaarten blijft een mysterie.

6 – Roken schaadt de gezondheid en …
Het Perth iX datacenter in het westen van Australië werd stilgelegd voor een uur nadat het VESDA (Very Early Smoke Detection Apparatus) systeem rook had gedetecteerd. De oorzaak; een smeulende sigarettenpeuk.

7 – Keep on Truckin’
Rackspace kreeg in 2007 te maken met een storing van enkele uren nadat een vrachtwagen zich in een transformatorhuisje had geboord, dat daardoor ontplofte. De back-up werkte niet en zorgde voor een groot aantal sites die down gingen.

8 – Aankondiging BGP
De Tsjechische provider Supronet veroorzaakte eigenhandig een wereldwijde uitval bij verschillende grote hostingbedrijven door een verkeerde BGP-aankondiging.

9 – Hier stond toch mijn server?
In 2007 werd in Chicago een datacenter midden in de nacht overvallen door twee gemaskerde mannen. De werknemer die op dat moment aanwezig was werd ge-tazered en ongeveer 20 servers werden uit het datacenter gestolen met als gevolg downtime voor die klanten.

10 – 9/11
Door de aanslag op de Twin Towers verdween er niet alleen een geheel datacenter op een van de vloeren van het WTC, maar door het instorten van de torens werden veel telecomkabels doorgesneden en ging de stroom plat in dat deel van New York. Vele datacenters hadden de eerste week enorme problemen.


Dit artikel verscheen op 2 juli 2014 op BlogIT.nl en is met toestemming van de auteur op ISP Today gepubliceerd.

Over Stijn Grove

Stijn Grove is directeur van de Dutch Datacenter Association en eigenaar van DatacenterAdvies.nl en thePeopleCloud.