FLASH: Tiering, Caching Of All-Flash?

In de race naar snellere en betere storage zijn de meeste merken een aantal jaren geleden begonnen om traditionele disk gebaseerde storage oplossingen te updaten door er een FLASH deel aan toe te voegen. De eerste oplossingen (Hybride, dus op basis van disken en een kleine hoeveelheid flash disken) die hier gebruik van maakte hadden nog geen erg geavanceerde software algoritmes en vaak was het voor een groot deel handwerk om de toevoeging ook daadwerkelijk van nut te laten zijn. Storagebeheerders braken hun hoofd over de beste instellingen en in verschillende sectoren kregen deze oplossingen door de arbeidsintensieve aanpak een slechte naam.

Een verademing dus en een soort Holy Grail toen de eerste All-Flash arrays medio 2011 haar intrede deed. Als alles op Flash zou draaien dan had je de Ferrari onder de storage te pakken. Tenminste dat was de belofte en ook een gedachtegang die bij vele opkwam. In de praktijk was het echter nog niet mogelijk om naast een betrouwbare performance ook enige capaciteit voor een betaalbare prijs aan te schaffen. Om het enigszins betaalbaar te kunnen maken deden technieken als: patroonherkenning, datadeduplicatie en compressie haar intrede en dat koste vaak performance maar belangrijker nog; je wist nooit precies wat je aan capaciteit echt beschikbaar zou krijgen op een bepaalde oplossing omdat het erg afhankelijk was (en is) van de data van de klant.

Meten is weten

Om de juiste afweging te kunnen maken tussen All-Flash, of Hybride met caching en/of tiering zal je de belasting van de omgeving moeten meten. Througput, I/O karakteristiek en de grootte van de datablokken zijn hierin van belang. Ook zal je bepaalde belasting op een server en andere weer beter op een storage systeem kunnen of moeten meten. In de praktijk wordt er nog veel met de duim gesized en gezien de snelle ontwikkeling en de afschrijvingstermijnen van bestaande oplossingen is een nieuw systeem al snel groot en sterk genoeg, maar haal je ook het beste eruit als je niet weet wat de karakteristieken zijn? Belangrijke punten om van je omgeving te weten zijn:

  • Protocollen die gebruikt worden naar de storage;
  • Type data (file, database, vdi, applicaties, ed);
  • Grootte van de dataset(s) en de te verwachten groei;
  • Aantal I/O’s (applicatie en storage) en de doorvoersnelheden.

Op basis van deze gegevens is een goede eerste inschatting te maken met wat voor soort storage oplossing je het beste af zou zijn als je 1 generiek systeem wil aanschaffen. Bij dat uitgangspunt moet je namelijk altijd een vorm van compromis maken omdat je niet voor iedere belasting of dataset een aparte oplossing zult aanschaffen.

Een tweede leven voor Hybride

Omdat de functionaliteiten op All-Flash (met name ook in integratie) nog altijd achterlopen en de prijsdaling van Hybride arrays veel sneller gaat bij een rijke functionaliteit dan de prijsaanpassing op All-Flash, hebben de Hybride array’s een nieuwe waarde gekregen voor veel klanten. De technieken om flash in combinatie met disken in te zetten zijn serieus verbeterd en het zijn voornamelijk geautomatiseerde processen geworden waar je geen omkijken meer naar hebt. In deze array’s wordt flash op twee manieren ingezet: tiering en caching.

Tiering

Tegenwoordig wordt bij tiering de data de eerste keer meestal naar een Flash laag geschreven en op basis van demotie zakt het naar een minder snelle tier indien er minder performance gevraagd wordt. Bij tiering staat de data altijd maar op 1 laag en je weet dus qua capaciteit goed wat je aanschaft en performance is goed betrouwbaar in te regelen. Wel zal je iedere laag afzonderlijk moeten beschermen voor dataverlies.

Caching

Maakt gebruik van een flashlaag om tijdelijk schrijf-lees acties in op te slaan en is dus bedoeld voor een meer tijdelijk karakter van een belasting. Een piek van belasting op de systemen van minuten tot circa een uur zijn goed op te vangen, maar als de belasting langere tijd aanwezig is dan zal je eerder naar een permanente tiering oplossing moeten gaan kijken.


Maar wat kies je dan?

Om de aanschaf of inzet van een storage oplossing enkel op flash en de toepassing daarvan te baseren is te eenvoudig voorgesteld. Ook uptime eisen, integratie met het applicatielandschap en de mogelijkheden bijvoorbeeld om met minimale verstoring naar een nieuw platform te migreren zijn belangrijke overwegingen. Wel is het heel goed mogelijk om op basis van een belasting van de huidige omgeving vaak een modelering te maken wat je voor die belasting voor een nieuw systeem zou moeten aanschaffen. Je zal daarnaast nog altijd het gezonde verstand moeten gebruiken om niet in de valkuil van leveranciers-tools te lopen.

1Appliance kan u ondersteunen bij het doen van een goede meting en sizing zodat u weloverwogen verschillende oplossingen naast elkaar kan leggen.