Molnvecka på TechWorld
Missa inte våra andra artiklar om molnet denna vecka!- Så fungerar molnet
- Ökad risk med data i molnet
- Standarder löser molnflytt
Molnet är främst ett samlingsbegrepp för tjänster och funktioner som utförs över internet. Självklart innefattar molnet även hårdvara, men att en serverhall plötsligt slutar fungera innebär inte att hela molnet havererar. Däremot drabbas förstås användarna i molnet indirekt av hallens avbrott.
Hårdvaruproblem orsakade avbrott
Ett exempel är Logicas serverhall i Bromölla som under en måndagsförmiddag i oktober 2009 plötsligt råkade ut för ett större strömavbrott. Följden blev att delar av hallen under en dryg minut helt släcktes ner, något som i sin tur ledde till stora problem för Logicas kunder. Exempelvis hade CSN såväl intranät och e-post som webbsida och handläggningssystem i de drabbade servrarna.
”Delar av datorhallen
släcktes ned helt under
en dryg minut.”
– Vi fick ett hårdvaruproblem i en utrustning, senare identifierat som en trasig kondensator, som ledde till en störning i strömförsörjningen. Utrustningen från en underleverantör testas varje månad men visade sig nu inte fungera, säger Anders Sandell, som är säkerhetsansvarig på Logica.
Certifiering ska förebygga
Hur många av Logicas kunder som drabbades av det några timmar långa avbrottet kan Anders Sandell inte svara på, men han vill poängtera att företagets kvalitetscertifieringar garanterar ett konstant förbättringsarbete och det förebygger liknande händelser i framtiden.
Certifieringar enligt säkerhetsstandarder är ett viktigt verktyg för leverantören av en molntjänst för att kunna ge kunden en extra trygghet. Om något inträffar innebär det ett rejält uppföljningsarbete, vilket ofta leder till handfasta åtgärder när utrustningen inte fungerar som den ska.
– För att det här inte ska hända igen har vi bytt ut två parallella system mot ett gemensamt, något som ska minska komplexiteten, säger Anders Sandell.
Ett strömavbrott drabbade även Com Hem i maj 2009 när en utsändningsstation slogs ut. Det resulterade i att telefoni, bredband och tv för drygt 800 000 kunder inte fungerade. Com Hems reservkylningssystem till datahallen använde vatten direkt från stadsnätet, men förbrukningen var så hög att Räddningstjänsten efter en timme hotade att stänga av försörjningen. Även här tvingades företaget att se över sitt reservsystem eftersom det inte var en hållbar lösning.
Ett problem som kan uppstå även vid korta spänningsfall är att ansluten utrustning tar skada. Då hjälper det inte att reservkraften startar som planerat. Det kräver ytterligare åtgärder och extra säkerhetsrutiner.
– Det finns en risk att snabbt växande företag inte hinner tänka på alla aspekter, till exempel att ha två separata strömförsörjningssystem, säger Rikard Hjelm som är produktspecialist på Juniper Networks.
Läckande kylsystem
Andra uppmärksammade hårdvaruhaverier förra året var bland annat ett större strömavbrott på FS Data som inträffade i nya lokaler innan dieselaggregaten hade hunnit installeras. Ett läckande kylsystem stoppade tillfälligt en av webbhotellet Crystones datahallar och väderrapporteringen blev lidande en dag i mars när SMHI:s filserver slutade att fungera.
”Väderrapporteringen blev
lidande en dag i mars när SMHI:s
filserver slutade att fungera.”
Den amerikanska molnleverantören Rackspace drabbades av inte mindre än tre större strömavbrott förra året, vilket ledde till att mångmiljonbelopp måste betalas ut i ersättning till kunderna.
Oavsett hur många säkerhetsprotokoll och rutiner som finns i bruk kvarstår den mänskliga faktorn som vanlig felkälla. Ett exempel är en extra punkt som en person stoppat in och som i oktober förra året tillfälligt stoppade åtkomsten av samtliga se-domäner, vilket fick en hel del uppmärksamhet. Orsaken var en rad brister i säkerhetsrutinerna hos Stiftelsen för Internetinfrastruktur. Det har åtgärdats med mer personal och utökade säkerhetsrutiner. Även andra länder uppmärksammade händelsen och det ledde i sin tur till översikt av säkerheten på fler håll.
Även stora får problem
Inte ens stora företag med miljontals användare, exempelvis Google, kunde undgå att drabbas av problem under fjolåret. Bland annat stannade Gmail tillfälligt i september på grund av en rutinmässig routeruppdatering som i stället för att omdirigera trafik ledde till en snöbollseffekt av överbelastade routrar. Ett flertal kortare avbrott påverkade även Googles övriga tjänster, bland annat på grund av oväntade effekter vid uppdatering av serverkod. Vid ett annat tillfälle lyckades ett fel i trafikstyrningen plötsligt skicka en stor del av all trafik över Asien.
– Det gäller att ha en plan då avbrotten sker, för det kommer de att göra, säger Jesper Ritsmer Stormholt, Nordenchef på Google Enterprise.
Han vill betona att samtliga avbrott som inträffade förra året löstes väldigt snabbt, oftast inom en eller ett par timmar.
Vid ett av de här tillfällena rapporterades dock att ett mindre antal Google Apps-användare inte kunde komma åt tjänsten på 22 timmar. Googles gratistjänster körs i befintligt skick och har över 100 miljoner användare, men betydligt högre krav ställs på företagsversionen Google Apps Premier Edition, som direkt påverkar den dagliga verksamheten på över två miljoner företag.
– Vi kör vår egen infrastruktur på samma plattform som våra kunder och användare. Det skulle vi inte våga göra om vi inte litade på systemet, säger Jesper Ritsmer Stormholt.
Innan ny kod körs in i utrustningen genomgår den rigorösa säkerhetskontroller, särskilt då Googles utrustning uppdateras under drift. För att undvika att tidigare fel inträffar igen har Google bland annat infört nya protokoll och tillsatt extra hårdvara för att hantera tillfälligt hög trafik, samt ytterligare förstärkt säkerhetsrutinerna för hur nya uppdateringar rullas ut.
I Googles fall ledde haverierna även till en ny funktion utåt för alla Google Apps-användare, Google Apps Status Dashboard. Verktyget visar i realtid om det uppstår några driftavbrott i Googles tjänster och det är även möjligt att titta bakåt i historiken.
Förlorade kunddata
Nästa exempel berör det som inte får inträffa i molnet, när en leverantör förlorar den lagrade informationen. Just det här drabbade T-Mobiles en miljon Sidekick-användare i oktober förra året.
Sidekick är i korthet en serie smarta mobiltelefoner på den amerikanska marknaden med fokus på e-post och snabbmeddelanden. En av telefonens funktioner har en synkroniseringstjänst som speglar telefonens innehåll (kontaktböcker, bilder och meddelanden) mot servrar som tillhör nu Microsoftägda Danger. Efter en standarduppdatering i Dangers servrar raderades plötsligt allt användarmaterial utan att någon säkerhetskopia fanns. Telefoner som försökte synkronisera mot servern tömdes dessutom på information.
Material som försvann
Först ansågs allt material vara permanent borta, men efter en månads arbete meddelade Microsoft att företaget hade lyckats återställa större delen av det som hade försvunnit. Många besvikna användare rapporterade dock långt efter det att de fortfarande saknade allt, eller delar av, sitt material.
Det är oklart hur mycket det här i slutändan skadade T-Mobile och Microsoft/Danger samt vem som bär det yttersta ansvaret, men följderna lär definitivt bli kännbara. En molntjänst som kan tappa bort information vill ingen använda.
– I dag befinner vi oss i en situation där det inte går att bedöma om leverantören klarar det den lovar. Leverantören kan komma med ett bra sla, service level agreement, men saknar möjlighet att visa att det kan upprätthållas. Det kommer att ta tid att etablera det förtroendet, säger Daniel Akenine, som är Microsofts svenska teknikchef.
Certifiering enligt iso
Det är av den anledningen som till exempel Microsoft vill iso 27001-certifiera sin kommunikationsplattform Business Productivity Online och Google vill Fisma-certifiera sina molntjänster. Salesforce var den första saas-leverantören som certifierade sina tjänster enligt iso 27001, redan 2008. Även om de här säkerhetscertifikaten i grunden inte är framtagna för just molntjänster ger de kunderna en extra trygghet eftersom det garanterar ett grundligt uppföljningsarbete av externa revisorer om något inträffar. Analytiker tvistar dock fortfarande om vad de här certifieringarna ger för typ av säkerhet i praktiken.
Tjänster i molnet är alltid synliga. Den lokala e-postservern kan vara ur funktion en hel natt innan någon kommer till kontoret dagen därpå och upptäcker det. En molntjänst förväntas däremot alltid vara tillgänglig, dygnet runt från jordens alla hörn. När en välanvänd tjänst inte fungerar är det alltid någon som lägger märke till det. Som följd verkar det ha medfört en lägre toleransnivå hos kunderna än tidigare.
– Användarna förväntar sig en extremt hög tillgänglighet och vill alltid ha tillgång till tjänsten. Fungerar det inte blir de snabbt upprörda, säger Jesper Ritsmer Stormholt.
Han får medhåll av Junipers systemutvecklingschef Christer Dierks:
– Vi är mer uppkopplade och därför mer beroende av att allt fungerar. När något inträffar märks det direkt, det ställer enorma krav på den som vill leverera en tjänst.
En utmaning är därför att ständigt kunna hålla en hög beredskap så att eventuella problem snabbt kan åtgärdas. Den ständiga exponeringen gör även att tjänsterna riskerar att bli utsätta för riktade attacker via så kallade botnät.
Bland annat har Juniper tagit fram något företaget kallar coordinated threat control, vilket i korthet är en brandväggs- och programlösning som identifierar angrepp via användarbeteende snarare än via specifika ip-adresser. Information om ett identifierat angrepp kan dessutom skickas vidare till andra datacenter och nätverk för att minska faran för andra. Även om skydden blir allt mer sofistikerade kan samma sak sägas om angriparna, därför försvinner risken aldrig helt.
Säkra informationen
För att informationen inte ska hamna i orätta händer eller råka försvinna måste tjänsterna vara oerhört säkra. Därför krävs enormt mycket av datacenter både när det gäller intrångsskydd och hur informationen hanteras internt i servrarna.
”Det allra viktigaste
handlar om att skydda
informationen.”
– Vi har hållit på med cloud computing i över tio års tid och det allra viktigaste handlar om att skydda informationen, säger Jesper Ritsmer Stormholt.
Exempelvis speglar Google ut all information, oavsett om det är en fil eller ett e-postmeddelande, inte bara över flera system utan även över flera datacenter. På så sätt ska ett helt datacenter kunna försvinna utan att någon information går förlorad, enligt Google.
Microsoft har valt att bygga sina nya datacenter för Windows Azure i par. Europas Azuretjänster med kommunikationsplattformen Business Productivity Online kommer att köras från Dublin och Amsterdam, något som ställer enorma krav när det gäller driftsäkerhet och anslutningsbarhet.
– Arkitekturen i Windows Azure bygger på ett gäng virtuella Windows 2008-servrar i botten med ett kodlager ovanpå som skalar ut de virtuella instanserna. Vi har skapat en plattform med hårdvara som kan slås ut utan att individuella program slutar att fungera, säger Daniel Akenine.
Mycket information på ett ställe
Daniel Akenine påpekar att även om redundansen i ett modernt datacenter är väldigt hög ökar riskerna när mycket information samlas på ett ställe. Konsekvenserna blir därför större när något väl inträffar.
Fjolårets många haverier i molnet innebär att ett antal brister har lyfts fram och rättats till. Samtidigt innebär fler tjänster i molnet att ett företag blir mer beroende av en fungerande uppkoppling än tidigare. Inget internet, inget moln. Det räcker därför inte bara att ställa krav på tjänsten – övriga led i kedjan måste också hålla måttet. 2009 blev haveriernas år när det gäller nättjänster. Vi fick bland annat uppleva flera Gmail-avbrott, strömavbrott i Logicas största serverhall och ett stavfel som tillfälligt gjorde samtliga se-adresser otillgängliga. Det sistnämnda hade visserligen inget med molntjänster i sig att göra, men det är ett tydligt exempel på att det fortfarande finns stora sårbarheter i nätet.
Fjolårets avbrott visar vad som är viktigt att tänka på när det gäller de tjänster ett företag har i dag, men även de tjänster som kommer att läggas i molnet i framtiden. På så sätt är vi bättre rustade när haverier väl inträffar.
Molnet är främst ett samlingsbegrepp för tjänster och funktioner som utförs över internet. Självklart innefattar molnet även hårdvara, men att en serverhall plötsligt slutar fungera innebär inte att hela molnet havererar. Däremot drabbas förstås användarna i molnet indirekt av hallens avbrott.
Illustration & grafik: Jonas Englund
» Så går du vidare
- www.iasa.se/?p=267 – IASA:s svenska definition av begreppet cloud computing.
- www.microsoft.com/online/sv-se/business-productivity.mspx – Microsofts nya molnbaserade kommunikationsplattform BPOS.
- www.google.com/appsstatus – Här kan du kolla statusen på Google Apps i realtid.
- www.citynetwork.se/ – Svensk molntjänst som utmanar Amazons EC2.
- www.juniper.net/us/en/solutions/enterprise/data-center/ – Junipers vision för framtidens enhetliga datacenter heter Stratus.




















































Relativt - (Oscar) 2010-02-17 15:23
Relativt - (hasse-kasse) 2010-02-17 15:44
Distrubera kapaciteten - (det är inte lätt att vara ett litet djur.) 2010-02-17 16:08
Antalet som drabbas det väsentliga - (incus) 2010-02-17 16:13
Antalet som drabbas det väsentliga - (Berger Brosa) 2010-02-17 16:34
Antalet som drabbas det väsentliga - (henkoooooooooo) 2010-02-17 16:57
Relativt - (Floye) 2010-02-17 17:57
Relativt - (Johan Ovonback) 2010-02-18 13:25
Relativt - (Johan Ovonback) 2010-02-18 13:49
Distrubera kapaciteten - (Larry Ellison) 2010-02-18 22:57