Biz sorunun kendi etkilendiğimiz boyutuyla yoğun şekilde uğraştığımız için gün içinde konuyu takip edemedim. Ancak şimdi baktığımda, ortada çok büyük bir felaket olmasına rağmen konuda çok saçma tartışmalar dönmüş,
13 yıldır Güzel Hosting markasıyla bu sektörde çalışıyorum. Yaşadığımız kaçıncı felaket/arızadır bilemiyorum, ancak şunu söyleyebilirim ki Netinternetin eski verimerkezinde elektrik gitti ve biz data kaybı yaşadık. Radore verimerkezinde elektrik gitti ve biz data kaybı yaşadık. OVH verimerkezinde elektrik gitti ve biz data kaybı yaşadık. Bugün de OVH komple yandı, diye data kaybı yaşadık.
2010 yılında Netinternet'de ilk felaketimizi yaşadığımızda, zaten hosting hizmeti verdiğimiz topu topu 2 sunucu vardı, bunun birinin tüm datasını kaybetmiştik. Geri de getiremedik, yedek de yoktu. RAID'e anlamsızca fazlasıyla güvenmiştik. Bu felaketten sonra harici yedekler almaya başladık.
Daha sonra yaşadığımız hiçbir sorunda benzer çapta bir kayıp yaşamadık. Ufak tefek bozuk yedek vb. kaynaklı kayıplar olmadı değil, ya da tek bir sunucunun geri yüklenmesinin 2-3 günü bulduğu olmadı değil(o yıllarda SSD disklerin yaygın olmamasının da etkisi var tabi ki), ancak sonuç olarak dersimizi almıştık ve bu sayede benzer sorunlarda müşterilerimize daha az kayıp yaşattık.
En son bu ocak ayında bir sunucu arızası yaşadık ve 2000'e yakın siteyi 24 saatten daha kısa sürede geri yükledik. Ancak 10-20 arası sitenin yedeği yoktu/bozuk çıktı. Biz de bu riskleri minimize etmek için oturduk çalıştık, yepyeni yedekleme sistemi getirdik, neticede bugün verimerkezi yangını olduğu halde 24 saatten kısa sürede 1000 civarı siteyi geri yüklemiş olduk, hem de kayıpsız şekilde.
Radore geçtiğimiz yıllarda yandı. Busbar yandı. Busbar'a su damlamış(ya da rutubet), ısı gittikçe artmış, farkedilememiş, büyük bir elektrik kesintisi oldu. Onlar da dersini aldı, dışardan bakanların saçma bulabileceği noktalara bile ısı sensörleri koymaya başladılar.
Yine geçtiğimiz yıllarda Netinternet'e yıldırım düştü. Herhangi bir enerji kesintisi olmadan atlattılar ama pek çok şey yandı, şansa atlatıldı, maddi hasar dışında hasar olmadı.
Bugün de gördüğünüz gibi OVH yandı. Bina yok oldu. 30000 kadar sunucunun yandığından filan bahsediliyor. Arkadaşlar bir durun düşünün, 30000 sunucu ne demek? Nasıl bir maddi kayıp bir düşünün. Sigortası var desek sunucuları bir şekilde amorti etseler yaşanan itibar kaybını toplamak çok zor. Adamlar bizim sağlam kalan sunucuların olduğu sistem odasına 19 Mart'da güç vereceklermiş, böyle planlamışlar, 9 gün birilerinin oturup data bekleyeceğini, down kalacağını düşünüyorlar. Ama sonuç olarak bu büyük bir kayıp ve buna karşı bir önlem almamış olmaları mümkün değil.
13 senedir ben bu sektörde olduğum sürece, bir çok sorun yaşadık. Etrafımızda da bir çok sorun yaşayan gördük. Bu süreçte öğrendiklerimiz ve edindiğimiz tecrübeler sayesinde, biz bu tip felaketleri daha kolay atlatır hale geldik. Olaylara yaklaşım şeklimiz hep değişti ve gelişti. Ama bu süreçte değişmeyen tek şey, olan arızalardı.
2 TR ve 1 OVH olmak üzere 3 verimerkeziyle çalışıyoruz, hepsinde sorun oldu. Tek değişmeyen şey bu.
Verimerkezi kaynaklı olmak zorunda değil, raid kartı arızasından RAID5 içinde eşzamanlı 3 disk arızasına, anakart üzerindeki CPU soketinin arızasına kadar(evet, saçma ama oldu) her çeşit sorunu, arızayı yaşadık. Biz bu sorunlara karşı aldığımız önlemleri geliştirdik, sorunlardaki reaksiyonlarımızı değiştirdik, tecrübe kazandık, ama her daim sorun oldu.
Bizim gibi hosting şirketleri olsun, OVH gibi verimerkezleri olsun, bunların tamamı insanlar tarafından kuruluyor ve yönetiliyor. Tüm felaket senaryolarını insanlar düşünüyor ve düşündükleri senaryolara önlem alıyor. Ancak tam o arada düşünülmeyen başka bir etken daha işin içine giriyor, o felaket gerçekleşiyor. Bu da tecrübe oluyor ve önlem alınıyor, bir daha olmaması sağlanıyor. Tüm dünyada bu sektör böyle işliyor. Kimsenin elinde "tüm sorunları anında düzelt" yazan bir buton yok, buna basınca düzelsin. Ya da "xxxx TL harcayarak tüm önlemleri al" butonu var da teknoloji şirketleri bu butona basmıyor değil. Hiçbir barındırma şirketi, müşterilerinin erişiminin kesilmesini, datasının kaybolmasını, sunucusunun yanmasını istemez. İnsanlar bildikleri, düşünebildikleri tehditlere önlem alırlar. Düşünülemeyenler her zaman olmaya devam edecektir.
Sizin bakacağınız konu bir felaket durumunda hizmet aldığınız şirkete ulaşabiliyor musunuz, hizmet aldığınız şirket sorunun çözümü için çalışıyor mu, gerekli önlemleri alıyor mu bunları değerlendirmek olmalı. "Sorun yaşadım disk bozuldu" ya da "sorun yaşadım yangın çıktı", "sorun yaşadım elektrik kesildi" diyerek şirket değiştirilmez. Bu çok saçma. Hizmetinizi taşıdığınız şirketin aynı sorunu aynı gün yaşamayacağının bir garantisi yok. OVH'ın yangın için almadığı bir önlemi almış olabilirler, ama başka birşeyi atlamış olabilirler. Bilinen hiçbir önlemi atlamadılarsa, akıllara hiç gelmeyen bir şekilde yine o yangın çıkabilir. Kimse ama kimse bunun olmayacağının garantisini veremez.
Kullanıcıların bu noktada her türlü felaketi düşünerek kendi önlemini yedeğini alması, sonrasında hizmet aldığı şirketin önlemlerine bakması en doğrusudur. Bir kullanıcı yedeğini almıyor ve hosting şirketi veri kaybı yaşadığında yıllarının emeğini kaybediyorsa, kimse kusura bakmasın ama en başta müşterinin kendisi suçludur. Müşteri yedeğini alıyor olsa hiç sorun yaşamayacak çünkü. Ama gelgelelim müşterinin hizmet aldığı şirket sürekli bu sorunu yaşatıyordur
müşteri yedeğini aldığı halde sürekli sorunla uğraşmak zorunda kalıyor ve downtime yaşıyordur, şirket sorunlara önlem almıyordur, o zaman müşteri "bu şirket işini iyi yapmıyor" diyerek değerlendirip hizmetini taşımalıdır.
Umarım anlaşılır olmuştur. Yerli/yabancı şirket kıyasına gerek yok, hizmet aldığınız şirketin yerli mi yabancı mı olup olmadığına bakmaksızın işini düzgün yapıp yapmadığına bakmanız yeterli.