Why RAID5 is often the wrong compromise
From the workshop

Why RAID5 is often the wrong compromise

Adam Kalisz
CS#storage#raid

Stále potkávám ve firmách nevhodnou volbu redundance vzhledem k bezpečnosti dat a výkonu. Specificky tím myslím úložné schéma s jednou paritou - RAID5. 😡

💡 RAID5 je schéma, kdy přidáním kapacity jednoho disku navíc jsem schopen zajistit, že jakýkoliv harddisk může selhat a všechna data budu schopen dopočítat.

🤔 To zní efektivně. Když mám úložiště s pozicemi na 12 disků tak můžu využít kapacitu 11 disků pro data - skoro 92% hrubé kapacity je využitelných. ALE, když potom vadný disk vyměním, tak při obnově a tedy běžné zátěži + čtení a tedy zátěž všech dalších disků, aby bylo možné chybějící informace dopočítat. Při obnově se může stát, že vypadne další disk a přijdu o veškerá data. Při kapacitě a rychlosti úložišť, hlavně hard disků už se silně nedoporučuje RAID5 používat, protože doba obnovy a tedy okno, kdy nemáme redundanci se prodlužuje‼️

💪 Výborně, tak přidáme další paritu a pravděpodobnost ztráty výrazně snížíme. Využíváme asi 83% kapacity na data, umíme se zotavit ze ztráty až dvou libovolných disků. Říkáme tomu RAID6.

🐌 Oba tyto systémy jsou pomalé na zápis, protože data musím rozdělit, dopočítat paritu, uložit a počkat, až mi zápis potvrdí i ten nejpomalejší disk a až poté můžu úspěch zápisu ohlásit. Naopak čtení je poměrně rychlé, protože můžu brát data z hodně disků.

🎯 Řešením je, získat výkon na úkor kapacity. Tento systém se jmenuje RAID10 a typicky se skládá z párů úložných zařízení, které mají ty samá data. Je to nejrychlejší schéma, ale je to tím, že polovinu kapacity investuji do redundance a výkonu. Když jeden disk umře, na obnovu redundance je potřeba číst jen z jeho kolegy, který samozřejmě pod zátěží nesmí také umřít. V reálu je to nepravděpodobné a obnova je velmi rychlá. Toto schéma se hodí pro databázové servery, logy, prostě všude tam, kde bude značná zátěž v zápisu i čtení.

Pokud mám tedy 12 pozic, můžu mít kapacitu:

  • 👉 6 disků a výborný výkon RAID10,
  • 👉 10 disků a tolerovat výpadek 2 libovolných disků s RAID6,
  • 👉 8 disků jako kompromis, tzv. RAID60, tedy 2x RAID6 z 6 disků. Tím se skoro zdvojnásobí výkon v zápisu, ale přijdu o kapacitu 2 dalších disků oproti jednoduchému RAID6. Ale pořád je to o 2 více, než u RAID10!

Nebojte se s námi projít strategii ukládání dat dokud vypadá úložiště zdravě.