Posts Tagged ‘upptid’

Minuter senare – Amazons EC2 går ner

Tuesday, October 6th, 2009

logo_awsVi hann inte mer än posta vår artikel om att Amazon är ett av de få företag i världen som kan stoltsera med att ha fler än 50000 servrar. Majoriteten, 40000, driver deras tjänst EC2.

Minuterna senare fick vi rapporter om att Amazon har haft rejäla  problem i helgen som gick. Vissa kunder har rapporterat om hela 19 timmars nertid. Bla har Web Host Industry Review skrivit en intressant artikel som beskriver mer i detalj vad ett antal användare har sagt och rapporterat in. Viktigt att påpeka är att detta är isolerade fall av nertid men uppenbarligen känsliga punkter för Amazons tjänst.

Här kan du läsa om företaget Bitbuckets frustration både via twitter kontot och bloggen där Jesper Nøhr beskriver mer i detalj både om vad som hände och dialogen med Amazon support. Uppenbarligen tog det tid för Amazon att gå med på att det faktiskt var problem med tjänsten. Det kan diskuteras om det faktiskt var Amazons fel. Det var i slutändan en DDoS attack som var isolerad. Jesper anser dock att det gick så pass lång tid med så mycket onaturlig trafik att något borde gjorts långt innan och framförallt – identifieringen av problemet borde gått snabbt. Detta kan vi hålla med om. 19 timmar nertid är extremt länge för en tjänst som denna. Dock tror vi inte någon tjänst är helt immun mot DDoS attacker. Man kan skydda sig mer eller mindre väl.

Intressant läsning och en realitetscheck för oss alla. Även med miljoner nerplöjda gäller det att ha koll på sitt nätverk. Amazon säger att de tar ytterligare steg för att förhindra liknande saker att ske igen.

Om du är intresserad av mer information kan du finna ytterligare en artikel här från The Register.

Det händer den bästa?

Tuesday, June 30th, 2009

Vi gick för ett tag sedan ut med vår 100% upptid garanti. Något som vi delar endast med de som anses vara de bästa i branschen. Rackspace är ett av dessa företag. Rackspace är ett större driftsföretag i USA. Vi har ett uttryck som säger att även månen kan falla ner? Nja så långt kanske man inte behöver gå – men igår så gick Rackspace Hostings data center ner och skapade en hel del kaos i USA.

Rackspace Hosting

Rackspace Hosting

Rackspace’s Robert Scoble beskrev incidenten i sin blog som ett “stort haveri”. Det finns inte något värre än att ha kunder som är nere.  Vi kan bara hålla med honom.

Många uppmärksammade förstås detta – inte minst kändisen Justin Timberlake som klagade via sitt Twitter konto.

Så vitt vi förstår fungerar allt nu normalt hos Rackspace. Det händer som sagt den bästa och det var mer än 18 månader sedan de hade ett riktigt större avbrott.

I ödmjukhetens tecken vill vi även säga att City Network hade nertid senast förra sommaren (ca 12 månader sedan) då sluttampen av vår utbyggnad av datacentrat resulterade i viss nertid.

100% garanterad upptid – bara hos City Network!

Sunday, June 28th, 2009

Dell servrarI förra veckan gick vi ut med en press release om 100% garanterad upptid för våra server kunder. Det gäller alltså både dedikerade servrar, co-location och våra virtualiserade servrar. Det är tre områden som vårt nya SLA driver på just 100% upptid och där kreditering sker vid första minut nertid.

1. Datacentrat i sig – dvs skulle tex kylan av någon anledning inte fungera så att en maskin måste stängas ner – då tickar klockan direkt och kreditering sker. Vi har trippel redundans i kyla där två huvudsystem skall avlösa varandra. Skulle detta mot förmodan dock ändå fallera – så sitter ytterligare ett system som tar över.

2. Hårdvaran – i de fall du hyr en tjänst av oss som i fallet dedikerade servrar och virtualiserade servrar – står vi för upptiden när det gäller hårdvaran. Dvs skulle någon del fallera och nertid skapas – sker kreditering vid första minuten. Som vanligt kör vi med rejäl redundans i vår hårdvara även på den minsta dedikerade servern som har RAID1 och dubbla nätverkskort mm.

3. Internetförbindelsen – kanske den viktigaste biten då det får en snabb direkt effekt om denna fallerar. Vi kör även här med trippel redundans. Vi har tre leverantörer som terminerar i tre olika städer i Sverige för högsta säkerhet och upptid. BGP4 kör vi för att kunna driva över trafik på andra linor om någon lina går ner. Det tar ca 30-45 sekunder att få över all trafik och det sker förstås automatiskt om något händer. Vi köper på oss rejält med bandbredd för även om du har två linor och kör dem fullt – så blir det sirap i den andra om en går ner. Dvs all trafik som går genom tre linor måste fungera genom en.

Vi jobbar hela tiden med både säkerhet och just upptid som en del av vårt förbättrningsarbete och har nu kommit långt nog för att vara den första i Sverige som garanterar just – 100% upptid. Vi hoppas andra kommer följa efter.