Qumulo Neden Farklı: Kullanılabilir Kapasite Kullanılabilir Kapasite Demektir

Qumulo ile depolama verimliliği

Qumulo size depolama sisteminizin kullanılabilir kapasitesinin ne olduğunu söylediğinde tam olarak şunu demek ister: Bu, dosyaları depolamak için kullanabileceğiniz kapasitedir. Gaye anlaşılır geliyor, yine de bu beyanı bir çok rakip yapamaz.Aslında, geleneksel veri koruma yöntemlerinin verimsizliği ve tam kullanımda ortaya çıkabilecek performans sorunlarını hesaba katan çoğu depolama markası kapasitenizin yüzde %30’unu kullanılmaz hale getirir. Tüm verilerinizi parmaklarınızın ucunda istediğiniz bir dünyada bu büyük bir kusurdur.

Qumulo’nun dosyalarınız için kullanılabilir tüm kapasiteye (petabayt ölçeğinde bile) performans ya da veri korumasından ödün vermeden nasıl güvendiğini açıklamak isteriz. Ne kadar çok dosya depolarsanız ya da bunlar ne kadar büyük ya da küçük olursa olsun bu geçerli. Aslında, milyarlarca küçük dosyayı da büyükleri kadar verimli bir şekilde depolayabilirsiniz. Bu sizin depolama biriminiz, ister iş için kullanın ister her şey için. Nihayetinde, “kullanılabilir kapasitenin” raporunun gerçek kullanılabilir alanı verip vermediğini merak etmeden de depolama yönetimi yeterince zorlu olabilir.

Neden eski dağınık depolama çözümleri atık kapasite için üretilmiştir

Qumulo ile geleneksel depolama markaları arasındaki fark köklerinin derinliklerinde yatıyor ve veri korumaya, küçük dosyası depolamaya ve yeniden oluşturma işlemlerine olan yaklaşımlarındaki temel farklardan kaynaklanıyor. Bunları birer birer ele alacağız.

Geleneksel veri koruma: Ağır düzeyde verimsiz olandan hafif düzeyde daha az verimsiz olana

Veri koruma açık bir şekilde tartışılamaz. Tüm kurumsal sınıf dosya depolama sistemleri diskler hata yapsa bile veri kaybını önleyecek şekilde tasarlanmıştır ve tümü bir biçimde depolama cihazları boyunca yedeklik ve bilgiyi kopyalamaya güvenir. Bununla birlikte kullanılan yaklaşım, depolanan veri miktarının kullanılan toplam disk kapasitesine bölümü olarak tanımlanan veri koruma verimliliğinde muazzam bir fark yaratır.

İkizleme, en gelişmemiş veri koruma biçimidir ve korunan verinin iki ya da daha fazla kopyasının oluşturulmasına dayanır. Her kopya farklı bir diskte yer alır, böylece disklerden biri hata yaparsa veri kurtarılabilir. Bu, kurtarma açısından verimlidir, ama ağır düzeyde verimsizdir ve dosyası depolamaya yönelik kullanılabilir kapasiteyi yarısına indirir.

İki eş zamanlı sürücü hatasına karşı korumak için verinin üç kopyasını alan çift ikizleme, kurtarma açısından çok daha verimlidir, ama ayrıca dosyaları için “kullanılabilir” kapasitenin üçte ikisini bıraktığından çok daha verimsizdir. Bu durumda, iki sürücünün korunması için ikizleme işleminde 1 TB dosyası verisini depolamak için 3TB ham kapasite gereklidir.

Petabayt ölçeğinde, gerçekte dosyaları depolamak için kullanamayacağınız depolama birimi bütçenizde oluşan bu üçte ikilik kaybı önlemek için ikizlemeden olabildiğince kaçınmak açıkçası tercih edilir.

Silme kodu (EC) ikizlemeye göre daha verimli, yanı sıra daha hızlı ve yapılandırılabilir bir veri koruması için en bilinen alternatiftir. EC’nin önemli bir avantajı sunduğu esnekliktir. Yöneticiler performans, fiziksel ortam hatası oluşması durumunda kurtarma süresi ve izin verilebilir eş zamanlı arıza sayısı arasındaki doğru dengeye karar verebilir.

Dosya düzeyinden ziyade blok düzeyinde çalışan EC, tüm veri hacminin birebir kopyasını oluşturmaya gerek kalmadan verinin verimli şekilde korunmasını mümkün kılar. Bunun yerine ayrı fiziksel ortamda depolanan yedek segmentlere kısmen blok veri kodlanır. En basiti olan ve (3, 2) kodlama olarak bilinen örnekte, iki blok kullanıcı verisini güvenle kodlamak için üç depolama bloğu kullanılır; üçüncü blok “eşlik bloğu” olarak bilinir ve kurtarma için kullanılır.

Eşlik bloğunun içeriği silme kodlama algoritması ile hesaplanır. Bu basit şema bile ikizlemeden çok daha verimlidir, yalnızca her iki veri bloğu için bir eşlik bloğu yazarsınız. Bir (3, 2) kodlamada, üç bloktan herhangi birini içeren disk arızalanırsa, blok 1 ve 2’deki kullanıcı verisi güvende kalır.

Sistem şu şekilde çalışır. Veri bloğu 1 kullanılabiliyorsa, o zaman yalnızca okursunuz. Aynısı veri bloğu 2 için de geçerlidir. Ancak, veri bloğu 1 kayıpsa, EC sistemi veri bloğu 2’yi ve ön eşlik bloğunu okur, ardından veri bloğu 1’in değerini yeniden oluşturur. Benzer şekilde veri bloğu 2 arızalanan diskte yer alıyorsa, sistemler veri bloğu 1’i ve eşlik bloğunu okur.

Bir (3, 2) kodlamada yüzde 67 verimlilik vardır, diğer bir deyişle kullanılabilir depolamanın üçte ikisi kullanıcı verisi için kullanılabilir, kalan üçte birlik kısımda veri koruma için kullanılır. Disk eklemek koruma seviyesini artırabilir. Örneğin, yine (3, 2) gibi yüzde 67’lik verimliliğe sahip olan bir (6, 4) kodlama, yalnızca bir yerine iki disk arızasını tolere edebilir. Diğer bir deyişle, iki disk aynı zamanda arızalansa bile, sistem hala duraklamadan ya da veri kaybı olmadan çalışabilir. Verimlilikte azalma olmadan gelen bu ekstra koruma da bedava değildir, (6, 4) kodlanmış veriyi kurtarma işlemi (3, 2) kodlamadan çok daha fazla çalışma gerektirir, bu da yeniden oluşturma süresinin daha uzun olduğu anlamına gelir.

Kurumsal sınıf depolamada, EC çok yüksek verimlilik sunabilir. Örneğin, (16, 14) kodlamada yaklaşık yüzde 85 verimlilik vardır ve hala ikiye kadar eş zamanlı sürücü arızasını veri kaybı olmadan kaldırabilir.

Bu noktada, bu yüzde 85’lik depolama verimi oldukça iyi görünebilir, özellikle de ikizlemeyi kullanan iki sürücülü korumanın yüzde 33’lük verimliliği düşünüldüğünde. Depolanacak yaklaşık 1PB dosyanız varsa, 1.2PB ham kapasite bunu depolayabilir, değil mi? Aslında gerekli değildir. Tekrar edersek, sayıların arkasındaki gerçeklik göründüğünden çok daha belirsiz olabilir.

Küçük dosya depolama: Eski markaların kullanılabilir kapasitenin altında kapasite sunmalarının bir diğer yolu

Depolama markanız kullanılabilir kapasitenin, silme kodlama eşlik bitlerine izin verdikten sonra kalan tüm alan olduğunu söylese de, bu alanın tümünü kullanabileceğinizi düşünemezsiniz. Ortaya çıkıyor ki eski dağınık depolama sistemleri konu küçük dosyalar olduğunda iyi bir iş çıkarmıyor. Küçükten kastımız 128KB ve altındaki dosyalar.

Bunun basit bir nedeni var. Eski depolama sistemleri, 128KB’dan küçük dosyalarda onları ikizlemeye (ya da çift ikizlemeye ve hatta üçlü ikizlemeye) zorlayan on yıllarca eski bir tasarıma dayanır. İkizlemenin verimsizliğini zaten tartışmıştık, şimdi bunun EC veri korumasında bile bir sorun olabileceği ortaya çıkıyor. En kötüsü de şu: Bu ikizleme için gereken alan markanın bildirdiği kullanılabilir kapasiteden düşülüyor. Bu bir sandviç satın almaya, ama sonra içini açtığınızda içinden büyük bir ısırık alındığını fark etmeye benziyor.

Bu ısırık ne kadar büyük? Başka bir sorun da bunu bilmenizin hiçbir yolu olmaması. Bu 128KB’lık sınırın altında kaç dosyası kaldığını görmek için yazmayı planladığınız her bir dosyanın kesin boyutunu önceden belirlemelisiniz, ve bunu tahmin etmenin hiçbir yolu yoktur. Sonuç olarak, gerçekte ne kadar kullanılabilir kapasiteye sahip olduğunuzu ya da kapasitenin ne zaman dolacağını bilmek imkansızdır. Bunun yerine açıkta kalmamak için aşırı tedarikli olmanız gerekecektir. Bu da bu bağlamda iki şekilde para harcayacağınız anlamına gelir: Birincisi küçük dosya depolama sorununda kaybettiğiniz “kullanılabilir” kapasite için ve ikincisi tedarik amacıyla satın aldığınız ek kapasite için.

Veri yoğunluklu bir işi yapmanın hiçbir yolu yok.

Yeniden oluşturma işlemleri: Disk kurtarmadaki gizli maliyet

Eski depolama markalarının size vaat ettikleri kullanılabilir kapasiteyi geri almak için bir yol daha olabilir. Bir çok sistem bir disk arızasından kurtarma yaparken yeniden oluşturma işlemleri için depolama kapasitesi tüketir ve bunun için kullanılabilir yeterli kapasite yoksa sistem kurtarma işlemini tamamlama konusunda sıkıntı çeker. Bu nedenle, çoğu marka vaat ettikleri kullanılabilir kapasitenin en fazla yüzde 80’inin kullanılmasını önerir. Yine buradaki durum da markanın “kullanılabilir” sözcüğüne ilişkin tanımının sorgulanmasına yol açıyor.

Qumulo neden farklı: Kullanılabilir kapasite kullanılabilir kapasite demektir

Qumulo farklı türde bir dosyası depolama şirketi. Biz kullanılabilir kapasitenin tam olarak söylediği şeyi ifade ettiğine inanıyoruz; dosyaları depolamak için güvenebileceğiniz alan miktarı. Qumulo’nun modern, ölçeklendirilebilir dosya sistemi ile dosyalar için kullanılabilir kapasitenin yüzde 100’ünü kullanabilirsiniz. İşte nedeni.

Daha akıllı blok düzeyinde veri koruma

Eski depolama markaları verimlilikte artımlı iyileştirmelere odaklanırken Qumulo temelden farklı bir yaklaşım ile endüstrinin tersine gitti. Veriyi diğerlerinin yaptığı gibi dosyası seviyesinde korumak yerine Qumulo blok seviyesinde koruyor, bu da büyük dosyalar için kullanılabilir kapasitede tipik olarak yüzde 20’lik kazançlar sağlıyor. Ve bu rakam resme küçük dosyalar dahil olduğunda ikiye katlanıyor.

Yüksek verimli küçük dosya depolama

Küçük dosyaları yönetirken, blok seviyesinde koruma dosya tabanlı korumaya göre yüzde 40’a varan daha fazla depolama verimliliği sunar. Bu, makine tarafından üretilen ve genellikle çok sayıda küçük dosya biçiminde olan veriler çağında özellikle değerlidir.

İşte gerçek bir kurumsal müşteriden bir örnek (Qumulo’ya gelmeden önce).

Bu müşteri yaklaşık 30 milyon küçük dosyayı eski bir depolama kümesinden bir Qumulo kümesine taşıdı. Soldaki iletişim kutusu bu dosyaların eski markanın küçük dosyaları ikizleyen sisteminde kapladığı alanı gösteriyor. Sağdaki kutu dosyaların Qumulo kümesinde kapladığı alanın miktarını gösteriyor. Görebildiğiniz gibi, eski markanın sistemi aynı dosyaları depolamak için üç katından fazla alana ihtiyaç duyuyormuş; 9.33TB dosya verisi için 33.2TB kullanılabilir kapasite. Qumulo kümesinde, bu yalnızca 9.49TB alan kaplıyor.

Böyle daha iyi görünüyor olmalı.

Aslında Qumulo’da büyük ve küçük dosyalar arasında depolama verimliliği açısından bir fark yok.

Bu şekilde ne kadar depolama alanına ihtiyacınız olacağını kestirmek daha kolay. İş yüklerinizdeki büyük ve küçük dosyaların karışımına ilişkin karmaşık kestirimlerle boğuşmak ve bu kestirimin yakın olmasını ummak yerine, ne kadar alanın kullanılabilir olduğunu görmek için web UI’sine bakabilirsiniz. Depolanan dosyalarınızın kaçının küçük ya da büyük olması fark etmeksizin aynı miktarda alan kaplar.

Yeniden oluşturma işlemleri kullanılabilir kapasiteden ısırık almaz

Qumulo’da, yeniden oluşturma gibi yönetim görevleri için kenarda kullanılabilir bir kapasite ayırmanız gerekmez. Bunun yerine, sistem kullanılabilir kapasiteyi bildirmeden önce ihtiyacı olan alanı ayırır. Yani sürücü arızalarını sistem yüzde 100 dolu olsa bile kurtarabilirsiniz ve bunun için boş alanı takip etmeniz gerekmez. Qumulo ayrıca geleneksel RAID’den daha hızlı yeniden oluşturma sunar ve sürücü arızasından sonra performans aktif noktaları dahil etmez.

Yüzde 100 kullanımda maksimum performans

Kullanım ile performans arasındaki denge depolama yöneticileri için çok bilindik bir konudur. Birçok ölçek büyütme sistemi, RAIDtabanlı sistemler ve daha popüler olan bazı açık kaynaklı dosya sistemleri, dosya sistemi doldukça performans sorunları yaşar. Performans sorunlarını önlemek için kullanılabilir kapasitenin yüzde 70’inin altında kalmanız önerilir. Kullanım ile performans arasında seçim yapmak durumunda kalmamalısınız, ama bir çok marka sizi bu pozisyonda bırakır.

Diğer bazı sistemlerin aksine, Qumulo’nun performansı sistem doldukça bozulmaz. Kapasitenizin yüzde 30’unu rezerve etmek yerine, devam edip yüzde 100’ünü kullanabilir, milyarlarca dosyayı performans üzerinde hiç etkisi olmadan depolayabilirsiniz.

Qumulo veriniz için ne anlama geliyor

Bir bütün olarak kombine verimlilik yararları, tipik bir Qumulo müşterisinin, aynı miktarda kullanıcı verisini, diğer dosya sistemlerinden yüzde 25 daha az ham kapasite kullanarak depolayabileceği anlamına geliyor.

Bu yüksek verimlilik veri açısından yoğun işler için önemli avantajlarla tamamlanıyor:

  • Bir disk sürücüsünün arızalanması halinde hızlı yeniden oluşturma zamanları
  • Yeniden oluşturma işlemleri sırasında normal dosya işlemlerine devam edebilme
  • Normal dosya yazma ile yeniden oluşturmadaki yazma arasındaki öncelik durumlarında dolayı bir performans azalması olmaması
  • Küçük ve büyük dosyalar için eşit depolama verimliliği
  • Doğru kullanılabilir alan raporu
  • Qumulo kümelerinin yüzlerce düğüme ölçeklendirme yapmasını sağlayan verimli işlemler
  • Arşiv fiyatlarına flash performansı sunan aktif/pasif veri için dahili katmanlama.

Veriniz, güncel olmayan eski depolama yöntemlerinin eline ya da “kullanılabilir kapasite” kavramını ellerinden kaçıran markalara bırakılmayacak kadar çok önemli. Qumulo, dijital çağdaki veri işlemleri için ihtiyaç duyduğunuz şeffaflık, öngörülebilirlik ve performansı sunuyor.