Så skete det umulige: Amazons cloudservices gik ned – i 4 dage!

Først vantro, så bestyrtelse, så resignation – og endelig: eftertanke. Det var de følelser, mange gennemløb ved nyheden om, at Amazons cloud services gik ned – ikke bare 1 time eller 1 dag, men reelt fire dage for nogle af kunderne… Nedbruddet ramte bl.a. EC2, der er en af verdens mest brugte og mest udbyggede cloud hostingløsninger for standard servere, men også f.eks. elastic block storage blev ramt.

Heldigvis for de iblandt os, der anvender Amazon i andre verdensdele, skete nedbruddet alene i et single availability center på østkysten af USA – men det gør ikke nedbruddet mindre kritisk for Amazon – faktisk nok tvært imod: østkysten er USAs administrative centrum og på mange måder også det forretningsmæssige center.

Først kom der ikke noget ud om nedbruddet. Så kom der nogle ret lakoniske meddelelser på nettet. Men så – da det hele var overstået – udgav Amazon en veritabel redegørelse for nedbruddet. Ud over at være et uhyre interessant dokument for teknikere, der synes, det er sjovt at læse om, hvordan en relativt banal opgradering af noget netværksudstyr, kunne få hele balladen til at ramle, er det også godt tænkt af Amazons pr-folk.

Skal Amazon genvinde tilliden i markedet – en tillid, der har været meget stor og begrundet i fantastisk få nedbrud i alle de år, Amazon som pioner har været på dette marked – skal der både dokumenteres handlekraft, omsorg for kunderne – og åbenhed til. Og det sidstnævnte er meget tydeligt kommet frem med den udførlige redegørelse, hvor de faktisk lukker lugen mere på klem ned til maskinrummet, end man normalt kan opleve.

Omsorgen for kunderne er også til at få øje på: kontante nedslag i prisen for de kunder, der blev ramt. Enkelte volumes (0,07% af driftcentrets instanser) kunne slet ikke genskabes, og dette kan i mere end bare teorien være ødelæggende for små og mellemstore virksomheder med måske en sparsom kapital og kundebase i ryggen. Men også store, velrenomerede virksomheder som e-mail-service provideren Epsilon kan det komme til at koste livet. Efter sigende har nedbruddet kostet Epsilon 225 mio. $ eller meget tæt på 1 mia. kr. Og da de jo har indgået aftaler med deres kunder om service levels og uden tvivl også sanktioner, hvis ikke disse levels kan overholdes, vil Epsilon formentlig blive ramt af en flodbølge af erstatningssager i de kommende måneder – vi taler jo USA…

Alt dette er mægtigt interessant, men i det lidt længere perspektiv kan man spørge sig selv, om begivenheden kommer til at svække tilliden til cloud leverandørerne og cloud computing i det hele taget, og ikke mindst om overgangen til cloud-baserede services vil vokse mindre eller måske endda stagnere i månederne, der kommer.

Twittere, Bloggere, it-presse – ja sågar dagbladene – har naturligvis ‘holdt fest’ i lyset af det spektakulære nedbrud (få her et australsk baseret overblik). Søgte man på Amazon Cloud Breakdown en uge efter begivenheden, fik man over 70.000 hits på Google – og det bare for én uge. Men leder man lidt grundigere finder man ind til mere tænksomme og perspektiverende artikler, end det, der glimrer og glitrer på forsiden af alverdens tech-blogs.

En rigtigt velovervejet gut er Michael Krigsman, der for ZDNet opsummerer betydningen for potentielle cloud-kunder i disse fem bullits:

  • The sky did not fall and cloud is here to stay
  • Cloud leverage can be either friend or enemy
  • Cloud is still maturing and evolving
  • Self-reliance and proper planning are critical
  • Learn from success stories

Altså med andre ord: Intet slår god forberedelse – og tag ved lære af succeserne mere ned af fiaskoerne.

AccountingWeb, som er et engelsk site for revisorer og regnskabsfolk, har også berørt begivenheden, og stiller sig selv spørgsmålet: Will the Amazon outage have a long-term effect on the Cloud? Spørgsmålet må vel henregnes til kategorien retoriske spørgsmål. Mere interessant er det vel at spørge, hvilken langsigtet effekt, nedbruddet vil have, og det er da også reelt det spørgsmål, de besvarer, og det endda ved hjælp af Gartners Kyle Hilgendorf, som sammenfatter sine synspunkter således (med hovedvægt på små og mellemstore virksomheder, som mange revisionsfirmaer jo er):

“The bottom line is that, for the majority of small and medium-sized businesses (especially those with no IT department), it’s a lot less risky (and a lot less effort) to use a proven cloud computing platform than it is to install software and manage the data themselves.”

I det store og hele tror jeg ikke, Amazons nedbrud får den store betydning for tilliden til cloud computing. Hvem har ikke oplevet datatab og langvarig udetid på systemer, man selv hoster, eller som hostes af en traditionel leverandør? Men oplevelsen – og måske især den omfattende mediedækning af den – vil formentlig få flere potentielle cloud-kunder til at overveje, hvordan man kan sikre sig imod de uheldige konsekvenser, der kan være af et sådant nedbrud.

Der er flere elementer, man kan tage ind i sådanne overvejelser:

  • Kan vi bygge vores applikation på en sådan måde, at den underliggende cloudplatform kan være dubleret – f.eks. baseret på services fra flere cloudleverandører?
  • Skal vores cloud-leverandørstrategi have flere ben at stå på, så det er muligt hurtigt at skifte over til en alternativ driftsplatform, hvis dele af den primære skulle falde bort?
  • Hvilke applikationer og services kan lægges i clouden, og hvilke skal vi sørge for at placere i miljøer, hvor vi en lavere risiko for at blive ramt af nedbrud?

Der er altid en risiko forbundet med at basere sine forretningskritiske systemer på én driftsplatform. I det mindste skal man sikre sig, at funktionsdygtige backups er placeret andre steder, så det hele ikke tabes ved et enkelt nedbrud.

Men samlet set er cloud-baserede services stadig noget af det mest driftstabile, man kan opnå. Og cloudleverandører er fortsat nogle af de mest specialiserede leverandører af netop de ydelser, de udbyder – i hvert fald hvis man baserer sig på etablerede leverandører med en ‘proven record’. Og her er Amazon fortsat blandt de absolut bedste.

Men som Michael Krigsman påpeger, er cloudplatformen fortsat under udvikling og modning, og som sådan skal den opfattes og bruges. Gør man det blot velovervejet, er risikoen ikke blevet væsentligt større efter Amazon-nedbruddet.

Dansette