Enligt uppgift ska Försäkringskassan IT-haveri bero på att man blev av med i princip all lagring, och i så fall måste återställa allting från förhoppningsvis fungerande backuper.
Försäkringskassan ska ha köpt in bladservrar från IBM, för att hantera lagringen på. Dessa sägs ha kraschat, vilket bland annat gjort att alla virtualiserade servrar, som man kör sina system på, blivit av med lagring. Och utan lagring så fungerar förstås ingenting.
Man ska ha tappat all lagring i två datahallar samtidigt. Så mycket för robusta virtualiserade system.
Specifikationen av virtualiserade system kan förstås variera. En ofta önskad funktion är att man ska kunna plocka ner och byta ut enskilda fysiska servrar utan att driften av system ska drabbas, men uppenbarligen hade man flaskhalsar i form av lagring som kunde sänka hela plattformen.
Om hela Försäkringskassans virtualiseringsplattform dök, så förklarar det varför samtliga system hos Försäkringskassan kraschade samtidigt.
Uppgifterna är inte bekräfta och är i andra hand.
Försäkringskassan hävdade nu på morgonen att deras onlinetjänster skulle vara uppe igen på förmiddagen. Hur man definierar förmiddag och uppe återstår att se. Det verkar som ordinarie webtjänst nu svarar, men är så långsam att definitionen av uppe är … speciell. Själv skickades jag till en engelsk hemsida, istället för den svenska. Är svensktalande i minoritet bland de som kontaktar Försäkringskassan, eller varför är grundinställningen den engelska hemsidan?
IDG skriver att även Pensionsmyndighetens system drabbats, eftersom de körs hos eller av Försäkringskassan, som nu även ska köra Arbetsförmedlingens system framöver. Pensionsmyndigheten körde dock sina pensionsutbetalningar redan förra veckan, så trots kraschen ska pensionerna betalas ut i tid. Vilket alltså inte hade skett annars.
16 kommentarer
Verkar funka nu.
Anna-Karin
Eller inte…
Anna-Karin igen
De verkar ha fått ordning på det mesta nu.
http://www.forsakringskassan.se/privatpers/aktuella_driftsmeddelanden2/fragor_svar_tekniska_problem/
Lång natt för IT-folket hehe
Två datahallar samtidigt. Är det åskan som varit framme?
Fast vad har virtualisering med problemen att göra? Fysiska servrar funkar inte heller så värst bra ifall man rycker bort all dess lagring (lokal alt. delad). 🙂
Virtualisering gör snarare att det blir enklare att faila över till annan hall (förutsatt att man inte har sumpat datat där också) samt att läsa tillbaka backuper och starta upp på annan server/plats.
Undrar hur många föräldraledighetsdagar man har kvar nu då. 😉
Synd det inte var skatteverket.
Länk till IDG om försäkringskassans nya datasystem.
Ofattbara 880 anställda tycker man behövs för att hålla 7 000 virtuella servar igång, nästan 1% av Sundsvalls kommuns befolkning.
Kan jämföras med Facebook som har 50 pers som sköter anläggningen i Luleå. Antalet servrar är hemligt men anläggningen har runt 120 MW kapacitet, så det handlar om i storleksordningen 100 000 servar.
http://techworld.idg.se/2.2524/1.578275/toppmodernt-datacenter-lyfter-forsakringskassan
Mer humor: Försäkringskassans IT-drift katastrofsäkrad med
hjälp av VMwares ESX-lösning. Inget fel på VMware i min mening dock men katastrofsäkrat blir det knappast bara för att servrarna är virtuella.
Här skriver man också ut vad det kostar försäkringskassan att driftsätta en fysisk server på marginalen: 45-50 000 kr. Antar att man installerade Windows NT från disketter?
Du jämför väl äpplen och päron här? Dels så sysslar Facebook-teknikerna i Luleå knappast med det som körs i systemen, utan mest det fysiska på plats? Dels så är det helt olika system och komplexitet. FK behöver ju integrera med en miljard andra myndighetssystem som de inte själva kan kontrollera, medan Facebook har lyxen av att få bygga mer från scratch.
Precis, inget blir katastrofsäkrat om man inte designar och bygger det ordentligt. Dessutom är det svårt att skydda sig mot att all lagring i båda hallarna ryker samtidigt. Då blir det till att börja läsa tillbaka från backuper och hoppas att dessa ligger på disk och inte på tape. 🙂
Citat: "Försäkringskassans centrala it-avdelning har 880 anställda och finns i Sundsvall. Enheten It-produktion har 380 anställda och enheten It-applikation 420 anställda"
Nu står det på IDG att felet berodde på att top-of-rack-switcharna på nåt sätt gjorde att servrarna tappade kontakten med lagringen. Det innebär att iaf ingen data har gått förlorad, vilket är trevligt.
Nanomiter.
Vilka glufsar i sig allt?