CEPH: Dataveiligheid door het CRUSH algoritme

De grote hoeveelheid apparaten in grote IT infrastructuren, maakt hardware gebreken eerder regel dan uitzondering. Hoewel ‘declustered replication’ een dataopslag strategie is om dataverlies te minimaliseren, laat deze strategie toch wat te wensen over. Gelukkig bestaat er nu het algoritme CRUSH.

Declustered replication

Voor de grotere storage omgevingen is ‘declustered replication’ een manier om data te beschermen. Bij ‘declustered replication’ wordt data in stukjes geknipt. Deze stukjes en kopieën ervan worden verdeeld over relatief grote groepen storage apparaten. Dit brengt doorgaans twee tegengestelde effecten met zich mee.

Voordeel: Verlaagde kwestbaarheid op additionele storingen

Ten eerste kan data herstel na een storing in parallel plaatsvinden. Dit komt omdat de hersteltaak niet in zijn geheel door een enkel apparaat uitgevoerd hoeft te worden, maar wordt verdeeld over meerdere apparaten die allen tegelijkertijd verantwoordelijk zijn voor het herstel van hun eigen stukje data. Hierdoor wordt hersteltijd verminderd en de kwetsbaarheid op additionele storingen, die vaak plaatsvinden tijdens intense herstelprocedures, verlaagd.

Nadeel: Verhoogde kwetsbaarheid op additionele storingen

Het tweede effect is dat een grotere groep apparaten ook juist een toename betekent in de kans dat een tweede storing op hetzelfde moment plaatsvindt, waardoor er dataverlies optreedt. Dit omdat er nou eenmaal veel meer componenten zijn.

Wat men hier tegen kan doen is zorgen dat er meer dan één kopie wordt gemaakt van een stukje data. Als er meer dan twee versies van een stukje data zijn, is de kans dat een van de versies bij een storing nog in tact is groter, waardoor de algehele dataveiligheid wel toeneemt.

Echter, als er meerdere storingen plaatsvinden, kun je niet verwachten dat deze onafhankelijk van elkaar zijn. In veel gevallen tast een enkele gebeurtenis, zoals een stroomstoring, meerdere apparaten aan. De grotere groep apparaten bij ‘declustered replication’ vergroten daardoor enorm het risico op dataverlies.

CRUSH

CRUSH, het algoritme waar CEPH gebruik van maakt, is hier de oplossing voor. Gebruikers worden in staat gesteld om te definiëren welke domeinen ‘storing-domeinen’ zijn. Met een storing-domein wordt bedoeld dat het aannemelijk is dat één of meerdere apparaten in een gemeenschappelijk domein ook aangetast wordt/worden als een apparaat in dat domein een storing heeft.

Het algoritme zorgt ervoor dat kopieën van data niet in hetzelfde domein worden geplaatst, maar worden verdeeld over domeinen. Dit is specifiek ontworpen om gelijktijdige, correlatieve storingen die dataverlies tot gevolg hebben te voorkomen.

De betrouwbaarheid van grote storage systemen wordt hiermee enorm verhoogt. Voor de grotere omgevingen is CRUSH van CEPH echt een aanwinst voor het realiseren van dataveiligheid.

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Google photo

Je reageert onder je Google account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s