1
Le stockage sur disques
V 2.1 15/10/09 15:52
PS
2
Avant propos
• Le stockage est une problématique importante en informatique
• Les disques durs constituent le premier média de stockage de par son bon compromis performances/capacité/coût
• Les besoins exponentiels en terme de stockage sont à l’origine de plusieurs problématiques que nous aborderons ici : la capacité de stockage double tous les 18 mois
Historique
• IBM 1956 : 30 Mo
• disques 8 ou 14 pouce
• 1984 : IBM PC XT : DD 5 Mo/100 ms –
Seagate Interface ST 506
Les unités de capacité • les unités de stockage (Ko, Mo, Go, To, ..) utilisaient
anciennement le coefficient 1024 (210)
• depuis 1998, l'IEC recommande (norme IEEE 1541)
d'utiliser les préfixes Kibi (Ki), Mebi (Mi), Gibi (Gi)
et Tebi (Ti)
• les Ko (KB), Mo (MB), Go (GB), To (TB) se réfèrent
maintenant aux multiples décimaux (1000)
• par exemple : 100 GB ~ 93 Gi
• les fabricants de disque utilisent les valeurs
réglementaires
5
La technologie des disques dur
• Les standards des interfaces :– ATA – SATA– SCSI
6
L’interface ATA• Dernière version Ultra-ATA 133 : 133 Mo/s• Gère 4 unités : 1 maître et un esclave sur chacun des
ports primaires et secondaires• Nappe de connexion 80 ou 40 connecteurs – 45 cm
maxi• Pas de périphériques externes• Installée en standard dans la plupart des CM de PC• Relativement peu efficace (1 seul transfert de données
sur une nappe)• Pas de hot-swap ni de hot-plug
7
L’interface SCSI - 1• Small Computer System Interface (Apple 1986)• Différentes versions depuis• Actuellement : SCSI 3• Utilise un bus parallèle avec des terminaisons
(bouchons)• Câble 16 bits (Wide) ou 8 bits (Narrow)
– 15 périph + carte en 16 bits– 7 périph + carte en 8 bits
• Les unités sont identifiées par des ID SCSI : LUN (Logical Unit Number) tous différents
• Nécessite une carte spécifique
8
L’interface SCSI - 2• Différents débits (40, 80, 160, 320 Mo/s )• Actuellement : Ultra320 320 Mo/s• Câble : LVD (Low Voltage Différential) : 12,5 maxi• Périphériques internes ou externes• Utilisable en Hot Plug ou Hot Swap• Excellentes performances : stocke les requêtes disque
(256), rend la main et les exécute en optimisant l’ordre d’exécution
• SCSI : protocole complexe à structure en couches comme les piles réseau
• Très adapté aux hauts débits
9
L’interface SCSI - 3
• Serial Attached SCSI (SAS-SCSI)– SCSI sur bus série– 3 Gb/s par périphérique (<> SCSI //) et du SATA– Câble fin 8 m– utilisation de connecteurs SATA– Jusqu’à 128 périphériques (ou + )– utilisable pour les SAN (Storage Area Network)– gestion des commandes en file d'attente– a remplacé le SCSI parallèle
10
L’interface SATA -1
• SATA/150 : 2003 (150 Mo/s)• Câble jusqu’à 1 m (4 connecteurs)• Alimentation spécifique• Hot-plug et hot-Swap• Pas de maître-esclave• Bande passante complète par disque (<> ATA)• Depuis 2004 : SATAII/300 • Actuellement SATA III/600
11
L’interface SATA -2
• Gère le NCQ Native Queue Command : gestion des files d’attentes de commande (similaire au SCSI mais en Half-duplex – SCSI : full-duplex) => meilleures perfs en environnement serveur (~ 10%)
• Alimentation spécifique non fournie
• eSATA : SATA pour périphériques externes– 300 Mo/s théorique– Câbles de 2 m.– Connecteur solide
12
Quelques chiffres
• DD SATA-3 1 To 7200 t/mn - 32 Mo - : 70 €
• DD SATA-3 450 Go 10000 t/mn 16 Mo : 230 €
• DD SAS2 450 Go 15000 t/mn 16 Mo : 350 €
13
La fiabilité
• Caractéristique primordiale des disques durs• Dispositif physique : usure => pannes• MTBF : Mean Time Beetween Failure
– De 500 000 (57 ans) à 1 400 000 heures
• Plutôt envisager la durée de vie (LifeTime) • la garantie : 3 ans pour ATA/SATA, 5 ans pour
SCSI• Nombre de cycles Démarrage/Arrêt : entre 30 000
et 50 000– + plus élevé sur les disques de portables
14
Les performance• Tps d’accès moyen : de 4 à 12 ms
• Débit : de 40 à 200 Mo/s
• Accès disque :– Positionnement du bras (Seek Time)– Temps de latence : attente que le secteur se positionne
sous le bras => ½ tour (7200 t/mn => 4ms)– Lecture
• La vitesse de rotation joue un rôle très important
• Attention : débit interface <> débit du disque
15
Perspectives
• Pendant longtemps, il y a eu une dichotomie marquée entre ATA (grand public) et SCSI (serveurs)
• Le SATA succède à l’ATA et joue le rôle du « SCSI du pauvre » : coût peu élevé, perfs convenables, possibilité d’intégrer un grand nombre de disques dans un boîtier : 5 x 500 Go => 2,5 To
16
I - La technologie magnétique
• Les principes de base
• Un disque recouvert d’un oxyde métallique passe devant une tête magnétique
• en lecture : l’alternance de particules magnétisées différemment produit un champ électromagnétique traduit en 0 ou 1
• en écriture : on envoie un courant dans la tête => magnétisation des particules (1) ou pas de magnétisation (0)
17
Mode d’enregistrement• enregistrement longitudinal : c'est le type le plus
utilisé actuellement, l'aimantation a lieu dans le plan de la couche, tangentiellement à la piste,
• enregistrement transversal : l'aimantation se fait encore dans le plan de la couche mais perpendiculairement à la piste
• enregistrement perpendiculaire : avec ce type d'enregistrement, qui se développe actuellement on atteint des densités d'enregistrement allant jusqu'à 20 milliards de bits par pouce carré. L’aimantation se fait perpendiculairement au plan de la couche.
18
Les modes d’enregistrement
19
Les technologies - 1• La technologie magnétorésistive ou MR
(MagnetoResistive) plus récente sépare la tête de lecture de celle d'écriture ce qui autorise une densité de stockage sur le plateau de 1 Giga bits/pouce2.
• La technologie GMR (Giant MagnetoResistive ou spin valve) permet d'atteindre, depuis 1997, une densité de 5 Gbits/inch2. Cette technologie est encore assez chère et réservée pour l'instant aux disques dur “ haut de gamme ”.
20
Les technologies - 2• Une technique de lecture PMRL (Partial
Response Maximum Likehood) est également utilisée en complément de ces technologies car elle améliore la qualité du signal. La méthode PMRL autorise une lecture plus rapide que la méthode classique de détection de pics (Peak Detection Read Channel) en éliminant la plupart des parasites et bruits captés par la tête de lecture. Le signal est lu comme un signal analogique puis converti en numérique.
21
Cylindres/Secteurs et Pistes• Les disques magnétiques sont constitués
de pistes concentriques
• chaque piste est divisée en secteurs habituellement de 512 octets
• Ex: Seagate Medalist – 3305 cyl, 16 têtes, 63 secteurs => 1705 Mo
• le LBA : on utilise le Logical block Addressing (N° de bloc à partir de 0 pour s'affranchir de l'architecture CHS (Cylinder, Head, Sector)
22
Organisation d’un disque
23
Formatage
• A l’origine , un support magnétique est électriquement neutre, l’opération de formatage est indispensable pour inscrire les repères que sont les pistes et les secteurs
• Attention : le formatage est une opération destructrice qui efface le contenu d ’un support magnétique
24
Partitions
• disques logiques : partie d’un disque physique
• les clusters: plus petite unité d’allocations : nbre entier de secteurs.
• Certains SE permettent de choisir la taille des clusters– petite taille : peu de perte de place, mais débit
peu élevé– grande taille : débit élevé pour les gros fichiers,
mais place perdue– ex : FAT 16 : taille cluster jusqu ’à 32 Ko !!!
25
Les disques durs• Matériau : aluminium ou substrat de verre-
céramique. Recouvert d'une couche magnétique.• Plusieurs plateaux superposés.• Sous tension, tournent en permanence à vitesse
constante dans une enveloppe scellée et étanche => technologie dite Winchester (IBM 3030).
• les têtes de lecture/écriture frôlent la surface magnétique sans la toucher, à une fraction de micromètre (1000 fois inférieure à l'épaisseur d'un cheveu : 0,25 à 1 µ : hauteur de vol).
• Si la tête touche : atterrissage de tête : crash !!
26
Disques rigides : Caractéristiques
• capacité : de 6,4 à 3 To • Vitesse de rotation• Temps d’accès • Taux de transfert• géométrie : nombre de disques
(plateaux) et de têtes• taille du buffer• MTBF (Mean Time Beetween Failure ) :
indicateur de fiabilité 1 million d heures
27
Caractéristiques : vitesse de rotation
• c’est un très bon indicateur global des performances d ’un disque
• varie entre 4200 t/mn et 15 000 t/mn
• les disques durs 10 000 t/mn sont les plus performants mais consomment beaucoup d’électricité et chauffent beaucoup : nécessité d’avoir une ventilation étudiée => limité aux serveurs
• Cheetah X15 de Seagate : 15000 t/mn
28
Caractéristiques : temps d’accès• Temps d’accès : tps pour positionner le bras
sur le secteur désiré– Temps d’accès moyen : entre 5 et 10 ms– Temps d’accès piste à piste : beaucoup plus
court
• le temps d’accès est constitué de deux parties– le temps de positionnement du bras puis tps de
stabilisation– le temps de latence : tps d’attente du secteur : lié
uniquement à la vitesse de rotation (50% du tps d’accès)
29
Caractéristiques : taux de transfert ou débit
• exprimé en Mo/s• de 10 Mo/s à 200 Mo/s (lié à a la vitesse de
rotation et au type d’interface)• Cheetah X15 : 100 Mo/s• ne pas confondre le temps de transfert du
disque et tps de transfert de l’interface– ex: 40 à 200 Mo/s pour le disque et 600 Mo/s en
SATA2
30
Caractéristiques : densité I• La densité linéaire ou densité d'enregistrement :
nombre de bits par pouce sur une même piste. Elle s'exprime en BpI (bit per inch) et va jusqu'à 522 000 BpI (IBM 1999). varie selon la position de la piste sur le plateau, la valeur fournie est une valeur moyenne.
• La densité radiale : c'est le nombre de pistes par pouce. Elle s'exprime en Tpi (track per inch) et peut aller jusqu'à 67 300 Tpi (113M 1999). On envisage d'atteindre 100 000 Tpi dans un avenir proche grâce à la technologie OAW.
31
Caractéristiques : densité II• La densité surfacique : c'est le rapport des deux densités
linéaires et radiales. Actuellement nous trouvons de 5 à 10 Giga bits par inch carré (Gbpi2) dans le commerce et 35,3 Gbpi2 (IBM 1999) en laboratoire. Cette densité est en constante et forte évolution - environ 60 % par an.
• De 1991 à 1997 la capacité des disques multipliée par 18 et leur prix est passé d'environ 31 francs le Mo à moins de 1 franc par Mo.
32
Caractéristiques : spécification Audio/Vidéo (AV)
• les disques durs ont fréquemment besoin d’effectuer une opération de recalibrage thermique qui prend un peu de temps et qui peut poser problème dans le cas d ’applications audio ou vidéo (montage) : de légers décalages se produisent
• pour remédier à ce problème, on doit utiliser des disques AV
• la plupart des disques SCSI haut de gamme sont conformes AV.
33
Caractéristiques : buffer• la taille du buffer ou mémoire cache
influence fortement les performances
• la plupart des disques dur disposent de 8 Mo voire même 16 Mo de mémoire cache.
• Cache multi-segment : cache divisé dynamiquement en plusieurs espaces. Les données y sont réparties en fonction de leur provenance
• cahe read-cache, read-ahead-cache, write-back-cache
34
Caractéristiques : plateaux et têtes
• nombre de plateaux : de 2 à 12
• nombre de têtes : habituellement 2 par plateau
35
Caractéristiques : facteur de forme
• Taille physique– 5,25 " (rare) => 47 To– 3,5 " (standard ) => 3 To– 2,5 " pour les portables => 360 Go– 1,8 « pour les ultra-portables => 160 Go
36
Caractéristiques : facteur d ’entrelacement
• les disques durs sont parfois trop rapides pour les possibilités de certains ordinateurs => ralentir la vitesse de transfert entre média et ordinateur : les données ne sont pas toujours écrites de manière continue mais avec un facteur d'entrelacement.
• En effet, si on lit le secteur 1 et que le système doive attendre un peu avant de lire le secteur 2 - alors que le disque tourne : on ne place ce secteur immédiatement après le 1 mais à une certaine distance (de 3 à 9 secteurs), variant en fonction du système.
37
Caractéristiques : fiabilité
• le MTBF est habituellement supérieur à un million d ’heures
• les disques SCSI haut de gamme sont garantis 5 ans.
38
Caractéristiques : influence de la géométrie
• le débit du disque est fortement lié à la position (intérieur ou extérieur du disque)
• il peut ainsi doubler selon la position– extérieur : 70 Mo/s– intérieur : 35 Mo/s
• Il sera donc judicieux d’en tenir compte pour l’implantation des partitions sur une machine : on implantera une partition de swap de préférence à l ’extérieur
39
Disques durs : les interfaces• A l ’origine: ST506 de Seagate (1980) DD
jusqu ’à 100 Mo
• Ensuite ESDI : évolution du ST506 plus performant
• ATA/EIDE : encore utilisée : (16 Mo/s maxi) - contrôleur intégré sur la carte mère - 4 périph. Maxi - fonctionne en mode PIO (de 0 à 4)
40
Disques durs : les interfaces - Suite
• Ultra-Dma : Double le débit par rapport à EIDE (33 Mo/s maxi)
• Ultra-DMA 66 : 66 Mo/s
• Ultra-DMA 100 : 100 Mo/s puis 130 Mo/s
• SCSI : plus chère et plus performante. Très utilisée sur les PC haut de gamme et les serveurs. Nécessite une carte spéciale (Ultra320 ou SAS). (320 Mo/s maxi)
41
L’évolution de l’interface ATA
42
SMART - 1 Self-Monitoring, Analysis and Reporting
Technology Technologie permettant de « détecter les
erreurs » grâce à des indicateurs pouvant annoncer un risque éventuel
Développée par Compaq Norme respectée par la majorité des fabricants
de disque
43
SMART - 2 Quelques données recueillies par les
systèmes SMART Nombre d'heures de fonctionnement Nbre de cycles marche/arrêt Taux d'erreur en lecture Température Débit Nbre de secteurs réalloués Taux d'erreurs de positionnement ...
44
Point forts - Points faibles
• Rapides• Fiables• coût au Mo peu élevé
• Non interchangeables
45
Un exemple : le Seagate Cheetah 15k
• vitesse de rotation : 15000 t/mn
• temps d ’accès moyen : 3,9 ms
• débit : jusqu’à 80 Mo/s en mode soutenu
• 16 Mo de mémoire cache
• interface : FC-AL Gb/s ou SAS-3Gb/s
• prix : 700 € pour 146 Go
• version 15k.6 : 400 Go et 164 Mo/s– MTBF 1,6 Mh– Tx d'erreurs : 1/ 10 E16
46
Quelques fabricants
• Seagate/Maxtor (Medalist, Barracuda, Cheetah)
• Samsung
• Fujitsu
• Western-Digital
Perspectives - I• les disques durs restent irremplaçables
(coût/Go le plus intéressant)
• le capacité continue à doubler tous les 18
mois/2 ans (enreg. perpendiculaire.)
• problèmes de fiabilité en perspective :
– 1 To = 1012 Octets
– tx erreurs non récupérable: Seagate
Barracuda : 1 pour 10 E14
– la capacité risque de rattraper le tx d'erreurs
Perspectives - II
• la capacité augmente mais pas les
performances => problème de vérification
des systèmes de fichiers (fsck sur partition 1
To : plusieurs heures) => nécessité de
repenser/reconcevoir les systèmes de
fichiers (ZFS Sun)
• Les SSD (Solid State Disks)
Perspectives - III• apparition des SSD (Solide State Disks)
– utilisation de mémoire NAND(cf. clés USB)
– pas de pièces en mouvement => pas de bruit, ni
pannes
– consommation très faible => peu de chaleur
– tps d'accès quasi nul : 0,1 ms
– débit intéressant : 280 Mo/s et 220 Mo/s en ecriture
pour les plus performants
– coût élevé (200 € pour 64 Go – format 2,5”/ATA)
Perspectives - IV• Les SSD (Solide State Disks)
– Pas de fragmentation
– nbre de cycles d'écriture limité : 100 à 300 000 ou 1 à 5 M
pour les meilleures => pb de veillissement (Static Wear)
– Algorithme de Wear Leveling pour repartir les écritures sur
l’ensemble du disque => SF spécifiques.
– Densité de stockage < celle des DD classiques
– MTBF : 600 000 h
– coût élevé (200 € pour 64 Go – format 2,5 »/ATA)