540 likes | 651 Vues
Module 4 Équipements de stockage des données. Version 1.0 22 Septembre 2011. Introduction. Introduction. L’information est au cœur de toutes les activités, et on estime que la croissance annuelle de la demande en stockage sera de 60% par an jusqu’en 2020 ;
E N D
Module 4Équipements de stockage des données Version 1.022 Septembre 2011
Introduction • L’information est au cœur de toutes les activités, et on estime que la croissance annuelle de la demande en stockage sera de 60% par an jusqu’en 2020 ; • Alors qu’on s’attend à ce que le stockage représente une source de consommation d’énergie de plus en plus importante dans les datacentres, il est capital d’améliorer l’efficacité énergétique des systèmes de stockage ; • Ce module utilise la terminologie adoptée par la Storage Networking Industry Association (SNIA), dans laquelle le terme «élément de stockage» fait référence à des systèmes de stockage tels que des sous-systèmes RAID et des serveurs de fichiers, alors que le terme «appareil de stockage» s’utilise pour caractériser des composants autonomes tels que des disques durs ou des SSD.
Taxinomie du stockage • La SNIA a suggéré une taxinomie des solutions de stockage de données afin de faciliter l’évaluation de l’efficacité énergétique des différents équipements de stockage. Cette taxinomie, qui d’une certaine manière est suivie par ENERGY STAR, possède les catégories suivantes : • Instantané/En ligne; • Accès quasi-instantané; • Bibliothèque de supports amovibles; • Médiathèque virtuelle; • Produits annexes; • Éléments d’interconnexion.
Taxinomie du stockage • Les catégories mentionnées précédemment sont divisées en sous-catégories qui prennent en compte plusieurs facteurs tels que la connectivité, le nombre de points d’échec et la capacité de service. • Cette taxinomie reflète aussi les différents niveaux de stockage observés au sein de systèmes importants tels que les datacentres. Une classification commune des différents niveaux comprend les catégories suivantes : • Instantané/En-ligne ; • Quasi-instantané ; • Hors-ligne.
Taxinomie du stockage • Dans les datacentres, les déploiements comportent fréquemment plusieurs niveaux (tiers) horizontaux de stokage généralement appelés Online 1, Online 2, Sauvegarde disque-à-disque, et archives de disques et supports amovibles. • Chacun de ces niveaux peut utiliser une approche d’organisation verticale, par niveaux elle aussi. Exemple de déploiement horizontal de stockage utilisant des solutions EMC. Chaque niveau peut à son tour accueillir une hiérarchisation verticale [EMC 2008]
Taxinomie du stockage • Les solutions de stockage telles que les ensembles de disques sont composées de disques qui fournissent une capacité de stockage brut, et de composants additionnels qui permettent l’interface avec les données brutes stockées tout en améliorant la fiabilité du stockage. • La terminologie SNIA fait référence aux composants unitaires qui constituent la capacité de stockage brute en tant qu’appareils de stockage : • Systèmes à bande magnétique ; • Disques durs ; • Disques SSD. • Une solution composite de stockage (e.g. produit de stockage en réseau) est qualifié d’élément de stockage.
Appareils de stockage Systèmes à bande, Disque Durs, Disques SSD, Disques Durs Hybrides
Systèmes à bandes • Les bandes sont le type de support de stockage le plus rentable à long terme. • Dans un scénario de stockage à long terme donné, tels que la sauvegarde et l’archivage dans des datacentres de taille moyenne, un disque dur coûte en moyenne 23 fois plus cher qu’un système à bandes et son coût d’alimentation et de refroidissement peut être jusqu’à 290 fois supérieur. • La consolidation des données avec un système d’archives sur bandes peut diminuer considérablement le coût opérationnel des centres de stockage. • Avec une durée de vie de 30 ans et de fortes capacités de stockage, les bandes sont une solution attractive pour les datacentres ayant des besoins importants en sauvegarde et archivage à long terme.
Disques durs • Les disques durs (DD) sont depuis longtemps le support de référence pour le stockage non-volatile de données, grâce à leur rapidité d’écriture et de lecture. • Un disque dur compte un ou plusieurs plateaux rigides, en rotation autour d’une broche motorisée et placés dans un châssis métallique ; • Les données sont enregistrées ou lues par les têtes de lecture qui flottent au-dessus des plateaux ; • Un bras actionneur déplace les têtes de lecture au-dessus des plateaux, permettant ainsi aux têtes d’atteindre la quasi-totalité de la surface du plateau en rotation. Illustration d’un disque dur (source : Wikipédia).
Disquesdurs • Leur consommation d’énergie est essentiellement liée à leurs pièces mobiles, telles que moteurs et têtes de lecture. • Pour améliorer le débit de données, les fabricants augmentent la vitesse de rotation des plateaux ce qui augmente en conséquence la consommation d’énergie du disque dur; • Les DD à haut débit actuels tournent généralement à 15 000 tr/min • Plusieurs techniques ont été proposées pour améliorer l’efficacité énergétique des disques durs.
Disques durs – Mode d’économie d’énergie • En réponse au programme Energy Star, les fabriquants de DD ont définis et mis en place des modes veille et inactif. • Dans ces états, des techniques comme le spin-down (baisse de la vitesse de rotation) et des vitesses de rotation variables sont utilisées ; • Le schéma ci-dessus illustre les mode d’économie d’énergie des ordinateurs. • Les cases foncées sont les modes généralement accessibles aux DD. • Si un PC atteint le mode «Sleep», alors toutes les activités des DD cessent virtuellement. • La mise en place du mode inactif varie selon les configurations.
Disques durs – Mode d’économie d’énergie • La technologie PowerChoiceTM de Seagate distingue par exemple trois modes inactifs distincts. • Les étapes spécifiques d’économie d’énergie mises en place par chaque état PowerChoice pour un DD 7200 TPM sont : • Inactif_A: Désactive la plupart du servo-système, réduit la consommation du processeur et des canaux, les plateaux restent à 7200 TPM. • Inactif_B: Désactive la plupart du servo-système, réduit la consommation du processeur et des canaux, les têtes de lectures sont rangées, les plateaux reste à 7200 TPM. • Inactif_C: Désactive la plupart du servo-système, réduit la consommation du processeur et des canaux, les têtes de lectures sont rangées, la vitesse des plateaux diminue. • Veille_Z: Les têtes de lectures sont rangées, le moteur d’entrainement est ralenti, et le disque répond uniquement aux commandes d’accès non-media.
Disques durs – Mode d’économie d’énergie • Economies d’énergie préliminaires réalisées pour les différents modes inactif et le mode veille pour un DD SAS 2”5.
Disques durs – Mode d’économie d’énergie • Economie d’énergie grâce au spin-down du disque en veille.
Disques durs – techniques de Western Digital • Western Digital utilise un certain nombre d’approches afin de diminuer la consommation énergétique de ses DD, en optimisant les temps de recherche et en réduisant la trainée aérodynamique des têtes de lectures sur les plateaux. • Les principales technologies sont décrites ci-dessous : • IntelliSeekTM: l’actionneur est asservi de manière à terminer ses mouvements juste à temps pour commencer la lecture/l’écriture de la suite de l’information, évitant ainsi les mouvements brusques et inutiles; • IntelliParkTM: après un temps d’inactivité préprogrammé, la tête de lecture est rangée dans un emplacement de garage afin d’éviter une trainée aérodynamique inutile sur le disque ; • IntelliPowerTM: un ensemble de technologies visant à équilibrer la vitesse de rotation des plateaux, les taux de transfert et la taille des caches afin de maximiser l’efficacité énergétique. • La combinaison de ces trois technologies a réduit de 40% la consommation des DD Caviar, par rapport à un DD standard.
Disque Dur – Diminuer le facteur de forme • Alors que les moteurs et actionneurs sont les principaux responsables de la consommation d’énergie, l’utilisation de Facteurs de Formes Réduits (FFRs), qui sont 70% plus petits qu’un châssis de DD 3,5’’, est une tendance d’amélioration. Consommation énergétique approximative de deux DD haute performance produits par Seagate.
Disque Dur – Diminuer le facteur de forme • Un facteur de forme plus faible entraine forcément une diminution de la consommation énergétique. • Lorsqu’actif, il consomme en moyenne 46% d’énergie en moins que son homologue de 3,5’’, cette différence pouvant atteindre 53% en mode inactif ; • En prenant comme données la consommation en mode actif, un prix de 0,11€/kWh et un total de 24 DD sur un an, 24 DD de 3,5’’ coûteraient 298€ par an, contre 160 € pour 24 DD de 2,5’’ ; • Pour seulement 24 DD, les économies réalisées atteignent 138€. • Dans des datacentres dont la capacité se chiffre en centaines voire milliers de DD, les économies réalisées se chiffrent en milliers d’euros.
Disques Durs – Autres techniques • Le Native Command Queuing (NCQ) est une technologie développée pour augmenter l’efficacité des DD SATA sous certaines conditions, en autorisant le DD à optimiser en interne l’ordre d’exécution des requêtes de lecture et d’écriture. • Cette technique, avec les cache mémoires, peut modifier l’ordre d’accès au disque, rallongeant ainsi les périodes d’inactivité et tirant profit des vitesse variables de rotation des plateaux. • Seagate rapporte que 70% des composants des DD Barracuda®+ LP seriespeuvent être recyclés ; • Des améliorations ont été faites de sorte que les DD haute performance aient une meilleure performance par watt consommé.
Disques SSD • Les disques SSD sont constitués, entre autres, d’une mémoire flash et d’un contrôleur assurant diverses tâches. • Contrairement aux DD, les SSD n’ont pas de composants mobiles, comme les moteurs ou les têtes de lecture. Composantsprincipaux d’un SSD
Disques SSD • Ils reposent sur la technologie flash NAND, qui emploie l’un des deux types de cellules de mémoire en fonction du nombre de bits que la cellule peut stocker: • Les Single-LevelCell (SLC) de capacité 1 bit/cellule; • Les Multi-LevelCell (MLC) de capacité 2 ou 4 bits/cellules. • Les cellules flash NAND ont un nombre limité de réécritures, en général entre 10 000 et 100 000, ce qui pose la question de leur fiabilité dans un premier temps. • Le Mean Time BetweenFailure(MTBF) des disques SSD est généralement amélioré en ajoutant des cellules flash supplémentaires, et en remplaçant les cellules défectueuses. • La mémoire des disques SSD est organisée en pages dont la taille varient de 512 à 4 096 octets, et toutes les opérations de lecture et d’écriture se font page par page.
Disques SSD • En raison de problèmes de conception et du nombre limité d’écriture sur les cellules flash, une opération d’écriture nécessite l’effacement complet des cellules visées, les opérations d’effacement ne se faisant qu’à l’échelle du bloc ; • Une page peut être modifiée (i.e. écrite) uniquement après que le bloc auquel elle appartient ait été effacé, ce qui rend les opérations d’écriture nettement plus coûteuses que celles de lecture, en termes de performance et de consommation ; • La mise en place du TRIM peut améliorer la performance en écriture en autorisant le système d’exploitation à signaler au disque SSD la libération de blocs d’écriture à la suite de suppressions de fichiers. • Cela permet au contrôleur SSD d’optimiser les commandes de suppression de données, améliorant de ce fait les performances en écriture.
Disques SSD • Les disques SSD sont plus fiables et plus efficaces énergétiquement grâce à l’absence de parties mécaniques, qui créent aussi de la chaleur. Disques durs versus disques SSD
Disques SSD • Comparaison entre le disque SSD professionnel Pulsar de Seagate et leur disque dur haute performance SAS 15 000 TPM
Disques SSD • Comparaison des performances d’un DD et d’un disque SSD pour des applications à accès aléatoire. Taux de transfert DD et SSD (MB/sec.) pour des transferts aléatoires
Disques SSD • En prenant en compte le coût en $ du MB, les disques SSD sont souvent à la traîne derrière les DD. Le scénario diffère toutefois lorsqu’on considère le coût par IOPS. • Les disques SSD sont une technologie très complémentaire pour équilibrer performance, capacité, disponibilité et gestion énergétique sur les différents niveaux de tiers. • Comme le prix des SSD baisse, ils deviennent une solution de stockage haute performance de plus en plus attractive.
Disques Durs Hybrides (DDH) • Les HDD sont des disques équipés d’une importante mémoire tampon (buffer) composée de mémoire flash non volatile afin de minimiser les opérations de lecture ou d’écriture sur les plateaux. • Grace à cette mémoire tampon, les plateaux des HDD sont au repos la plupart du temps, plutôt qu’en rotation continue comme sur un DD. • Ces mémoires flash additionnelles peuvent réduire la consommation des solutions de stockage en réduisant la puissance consommée par le moteur et les parties mécaniques.
Eléments de stockage Ensembles de disques et technologie MAID, stockage à connexion directe (DAS), stockage en réseau (NAS), réseaux de zone de stockage (SAN)
Eléments de stockage • Les éléments de stockage – ensembles de disques, stockage en réseau ou à connexion directe sont utilisés et combinés pour améliorer l’efficacité énergétique de solutions de stockage composites. • En choisissant des solutions de stockage en réseau et en les concevant, il est essentiel de connaître le type d’activité qui bénéficiera de ces solutions. • Un élément ou une solution de stockage mis en place dans un datacentre compte généralement plusieurs composants : • Baies de stockage ; • Contrôleurs, cartes réseaux ; • Disques durs, disques SSD ; • Alimentations ; • Ventilateurs ; • PDU, blocs d’alimentation.
Eléments de stockage • En choisissant des solutions de stockage en réseau et en les concevant, il est essentiel de connaître le type d’activité qui bénéficiera de ces solutions. Besoins en performances, connectivité et disques des applications
Eléments de stockage – Ensembles de disques et MAIDs • Un ensemble de disques est un système de stockage contenant de multiples disques durs. • Just a Bunch of Disks(JBOD) ; • SwitchedBunch of Disks(SBOD) ; • ExtendedBunch of Disks(EBOD). • Comptent parmi les éléments courants d’un ensemble de disques : • Contrôleurs de baies ; • Mémoires caches ; • Châssis de disques ; • Alimentations. • Les ensembles de disques peuvent être directement connectés à des serveurs par une série d’interfaces, ils font souvent partie d’un système de stockage plus complexe tels qu’un stockage en réseau (NAS) ou un réseau de zone de stockage (SAN).
Eléments de stockage – Ensembles de disques et MAIDs • Afin d’améliorer la fiabilité et la tolérance aux pannes, les ensembles de disques sont souvent alimentés de manière redondante. • Les DD sont les éléments les plus consommateurs d’une baie de stockage ; • Il est capital de choisir des DD efficaces énergétiquement et qui présentent des fonctions minimisant leur consommation d’énergie en marche. • Les niveaux RAID affectent aussi l’efficience énergétique d’un système de stockage, car les DD utilisés pour la protection des données consomment de l’énergie en dépit de leur absence de travail effectif. Efficacité des niveaux RAID
Eléments de stockage – Ensembles de disques et MAIDs • Il est important que les sources d’alimentation des baies de stockage soient performantes énergétiquement. • Afin de réduire la consommation énergétique et les coûts des sous-systèmes de stockage, les baies de stockage utilisent : • DD à vitesse variable ; • DD à spin-down ; • Stockage mixte. • L’efficacité de plusieurs outils d’économie d’énergie dépend souvent de la charge de travail imposée aux équipements. • Les Massive Array of IdleDisks(MAID) peuvent entrainer jusqu’à 70% d’économies. • Les économies d’énergie sont en général considérables lorsque la technologie MAID est appliquée au stockage near-line, où les ressources de stockage peuvent rester inactives pendant de longues périodes.
Eléments de stockage – Ensembles de disques et MAIDs • MAID utilise une combinaison de mémoires cache et de DD inactifs pour gérer les requêtes, faisant tourner les DD uniquement si nécessaire. • L’arrêt de la rotation des plateaux sur des DD auxaccès moins fréquents peut diminuer la consommation d’énergie. • La quantité d’énergie que l’outil MAID peut permettre d’économiser dépend de l’application utilisant les disques, et de la fréquence à laquelle elley accède.
Eléments de stockage – Ensembles de disques et MAIDs • La technologie MAID en est à sa seconde génération, qui met en place un Intelligent Power Management (IPM), avec plusieurs modes d’économie d’énergie et de performance. • La configuration courante de niveaux MAID est: • Niveau 0 : • Opération normale, tourne à 7200 TPM, têtes de lectures actives. • Niveau1 : • Les têtes de lecture des DD sont désactivées. • Temps de remise en route inférieur à la seconde. • Niveau2 : • Les têtes de lecture des DD sont désactivées. • Les plateaux ralentissent à 4000 TPM. • Temps de remise en route: 15 sec. • Niveau3 : • Les DD arrêtent de tourner (mise en veille activée, alimentés) • Temps de remise en route: 30 à 45 sec.
Eléments de stockage – Ensembles de disques et MAIDs • Nexsan revendique qu’en mettant en place les stratégies appropriées pour déterminer les niveaux MAID et les vitesses d’accès nécessaires,on peut économiser jusqu’à 70% de la consommation énergétique. • MAID peut considérablement bénéficier de disques durs avec des états inactifs multiples. Puissances moyennes nécessaires pour les différents niveaux d’AutoMAID
Eléments de stockage –Stockage à connexion directe (DAS) • Le DAS est un système de stockage des données attaché à un hôte sans réseau intermédiaire. • Les protocoles principaux pour connecter un DAS à un hôte sont SATA, eSATA, SCSI et SAS. • Les solutions DAS bénéficient d’améliorations de leur efficacité énergétique grâce à des équipements tels que les DD, les disque SSD et les ensembles de disques. • Les fabricants de DAS ont suivis plusieurs pistes d’améliorations de l’efficacité des DAS telles que: • Amélioration des unités d’alimentation ; • Utilisation de DD haute capacité pour certaines applications ; • Cohabitation de différents types de DD au sein d’un même châssis, afin de permettre une hiérarchisation (tiering) verticale du stockage ;
Eléments de stockage –Stockage à connexion directe (DAS) • Introduction de châssis à faibles facteurs de forme afin économiser l’espace au sol dans les datacentres et réduire l’empreinte énergétique en utilisant des DD 2,5’’ plus efficaces énergétiquement ; • Utilisation de mécanismes et de niveaux RAID plus efficaces énergétiquement ; • Ventilateurs asservis et contrôlés par la température pour des performances et une efficacité énergétique optimale. Performance SPC-1C et consommation en énergie des ensembles DAS Dell PowerVault MD1000 et PowerVault MD1120
Eléments de stockage - stockage en réseau (NAS) et réseau de stockage (SAN) • Pour éviter de créer des « ilôts d’informations », les SAN visent à consolider les données en permettant aux serveurs d’accéder aux équipements de stockage via des réseaux, généralement par blocs en utilisant des protocoles tels qu’iSCSI, Fibre Channel Protocol (FCP) et Fibre Channel over Ethernet. • Les principaux composants et couches d’un SAN :
Eléments de stockage - stockage en réseau (NAS) et réseau de stockage (SAN) • Plusieurs types d’applications peuvent bénéficier de solutions SAN : • Les applications haute performance peuvent utiliser les SAN pour le stockage de données et la création de points de sauvegarde ; • Via le thinprovisioning, certaines applications peuvent attribuer de l’espace d’un SAN sur demande ; • Les applications de base de données qui veulent des accès rapides peuvent bénéficier de la faible latence pour accéder à des blocs mémoires dans des SAN ; • Les opérations de sauvegarde d’une entreprise peuvent être centralisées ; • La virtualisation des serveurs peut utiliser de façon intensive des SAN pour stocker des images de machines virtuelles et permettre leur migration. • Un SAN n’ayant pas toujours besoin d’une IP, des opérations coûteuses (conversion de blocs en paquets IP) peuvent être évitées. • Un SAN diffère d’un NAS, dans le sens où celui-ci n’offre généralement pas d’outils pour exposer les appareils de stockage aux serveurs en tant que services au niveau fichier.
Eléments de stockage - stockage en réseau (NAS) et réseau de stockage (SAN) • Un NAS est un serveur spécialisé qui possède sa propre IP, accessible à plusieurs clients ou serveurs sur un réseau. • Des protocoles standards tels que iSCSI et Fibre Channel sont utilisés pour communiquer avec des systèmes NAS ; • Contrairement au SAN qui utilise un protocole au niveau bloc, le NAS communique avec des protocoles au niveau fichier, comme les Network File System et les Common Internet File System (CIFS). • Les NAS et les SAN peuvent être combinés de manière à consolider le stockage en réseau.
Eléments de stockage - stockage en réseau (NAS) et réseau de stockage (SAN) • Options d’amélioration de l’efficacité énergétique et des coûts : • Combinaison de serveurs et de stockage virtuels ; • L’efficacité classique des baies de stockage traditionnelles se situe aux alentours de 30-40%. La virtualisation peut augmenter cette efficacité à 70% ou plus selon certaines sources ; • Thinprovisioning ; • Cette technologie complète en général la virtualisation du stockage et vise à optimiser l’utilisation du stockage et éliminer les espaces de stockage pré-alloués mais inutilisés ;
Eléments de stockage - stockage en réseau (NAS) et réseau de stockage (SAN) • Découpage en niveaux de stockage horizontaux : • Pour une utilisation efficace d’une infrastructure de stockage, il est important de concevoir et appliquerdes pratiques de gestion des données sensées, qui utilisent différents tiers selon : la fréquence d’accès aux données, si elles sont réutilisées et la durée nécessaire de stockage ; Valeur des données dans le temps et utilisation des différentes technologies
Eléments de stockage - stockage en réseau (NAS) et réseau de stockage (SAN) • Découpage en niveaux de stockage verticaux : • Les techniques de tiering au niveau des ensembles et éléments de stockage peuvent améliorer la performance et réduire la consommation énergétique ; • Consolidation au niveau matrice et couche de stockage : • La consolidation des équipements de stockage et réseaupeut mener à des gains de surface au sol et de consommation d’énergie ; • Déduplication des données : • Les infrastructures de stockage contiennent souvent plusieurs copies des mêmes données. Les données y sont multipliés à plusieurs niveaux, afin d’améliorer la fiabilité et le transfert de données, mais certaines des copies sont inutiles et leur suppression libère de l’espace de stockage ; • Compression de données: • En compressant/décompressant efficacement les données pendant leur utilisation, la capacité de stockage peut être recyclée. La compression de données est utilisée depuis longtemps dans la transmission pour minimiser la quantité de données transmises sur le réseau.
Recommandations et bonnes pratiques Améliorer la fiabilité du stockage, Gestion efficace des données, Déduplication et consolidation des données, Stockage en tiers et Virtualisation, ThinProvisioning, Utilisation de DD efficaces énergétiquement, Basculement vers des disques SSD.
Recommandations de bonnes pratiques • Les améliorations ou solutions ne concernent pas spécifiquement les équipements de stockage et englobent des systèmes d’aération plus performants, l’usage de la virtualisation des serveurs, l’augmentation de la température dans les datacentres, des PDU et des UPS plus efficaces. • Améliorer la fiabilité du stockage ; • Les architectures de stockage actuelles ont été conçues pour anticiper une défaillance des équipements. Si les équipements sont plus fiables et sujets à moins de pannes, les doublons dans le stockage peuvent être réduits, diminuant ainsi la consommation de la structure d’ensemble. • Gestion efficace des données; • Une des causes principales de l’explosion actuelle de la quantité de données à laquelle font face les datacentres, est le nombre de doublons de données qui sont conservées par les organisations.
Recommandations de bonnes pratiques • Déduplication et consolidation des données ; • La déduplication des données est très importante pour éliminer les doublons et libérer de l’espace de stockage ; • Virtualisation et stockage par niveau (tier); • Lors de la conception de l’infrastructure de stockage d’un datacentre, il faut correctement définir les niveaux de tieret avoir une politique claire en termes de sauvegarde, de transfert, d’archivage et de récupération des données. Le chiffrage de la consommation énergétique dans les politiques de transferts de données est important afin de fournir un équilibre performance/économies d’énergie. • Thinprovisioning ; • Les solutions de stockage en thinprovisioningpermettent d’éviter le gaspillage de capacité de stockage par la pré-allocation de ressources de stockage qui ne sont pas utilisées en réalité par les applications.
Recommandations de bonnes pratiques • Utilisation de disques efficaces énergétiquement ; • Parallèlement à l’utilisation de technologies MAID, l’utilisation de disques efficaces énergétiquement est pertinente pour des solutions d’ensembles de disques ; • Basculement vers des disques SSD ; • Les disques SSD sont naturellement plus efficaces énergétiquement et plus fiables grâce à l’absence de parties mobiles. De plus, des rejets de chaleur plus faibles signifient des exigences en terme de refroidissement moins élevées.
Discussion Questions relatives à ce module