View
295
Download
1
Category
Preview:
DESCRIPTION
computer science
Citation preview
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 1/42
Paisjet I/O
Leksioni IX
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 2/42
Hyrje
Paisjet I/O mund te karakterizohen nga Sjellja: input, output, storage
Partneri i komunikimit: njeriu ose makina
Sasia te te dhenave ne sec: byte/sek, transferime/sek
Buset e lidhjes se I/O
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 3/42
Karakteristikat e sistemit I/O
Siguria eshte e rendesishme Sidomos per paisjet e ruajtjes se informacionit
Njesite matese te performances Latency (response time)
Throughput (bandwidth)
Desktopet dhe sistemet embedded Kryesisht te interesuar ne response time dhe
diversitetin e paisjeve
Serverat Kryesisht te interesuara ne throughput dhe ne
zgjerueshmeri
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 4/42
Siguria
Gabim: deshtim i nje
komponenti Mund ose jo te coje
ne deshtimin esistemit
Kryerja e sherbimitSherbimi realizohet
sic u kerkua
Nderprerja e sherbimitDevijimi nga sherbimi
i duhur
DeshtimRikthim
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 5/42
Njesite e sigurise
Besueshmeria: mean time to failure (MTTF)
Nderprerja e sherbimit: mean time to repair(MTTR)
Mean time between failures
MTBF = MTTF + MTTR
Disponueshmeria = MTTF / (MTTF + MTTR)
Permiresimi i disponueshmerise
Rritja e MTTF: shmangia e gabimeve, toleranca ndajdeshtimit, parashikimi i gabimeve
Reduktimi i MTTR: Permiresim i proceseve dheveglave per parashikim dhe riparim
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 6/42
Disk Storage
Jo volatile, disk magnetik ne rrotullim
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 7/42
Sektoret e diskut dhe aksesi
Cdo sektor ruan Id e sektorit
Te dhenat (512 byte, 4096 byte)
Kodet e korigjimit te gabimit (ECC) Te perdorura per te fshehur defektet ose gabimet ne ruajtje
Fusha sinkronizimi dhe hapsira
Aksesi ne nje sektor perfshin Vonesen ne rradhe nese ka kerkesa te tjera
Seek: levizja e kokes
Vonesa e rrotullimit
Transferimi i te dhenave
Vonesa e kontrollerit
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 8/42
Aksesi ne disk shembull
Kemi 512B sektor, 15,000rpm, 4ms seek time
mesatare, 100MB/s shpejtesi transferimi,0.2ms vonesa e kontrollerit, disku eshte i lire
Koha mesatare e leximit 4ms seek time
+ ½ / (15,000/60) = 2ms vones e rrotullimit+ 512 / 100MB/s = 0.005ms koha etransferimit
+ 0.2ms vonesa e kontrollerit= 6.2ms
Nese “seek time” mesatar eshte 1ms Koha mesatare e leximit eshte = 3.2ms
P bl t f
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 9/42
Probleme te performances se
diskut Prodhuesit percaktojne seek time mesatar
Ne varesi te gjithe vonesave te mundshme
Lokalitati dhe skedulimi i SO ben qe te kemi seek timeakoma me te vogel
Kontrolleri i diskut alokon sektoret fizike ne disk I prezanton sektoret llogjike hostit
SCSI, ATA, SATA
Disqet e ngurte perfshijne edhe cache
Ngarkojne parakohe sektoret qe mendohen teaksesohen
Shmangin vonesat qe lidhen me leximin
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 10/42
Memoria flash
Jo volatile e ndertuar me gjysempercjellesa 100× – 1000× me e shpejte se disku
Me e vogel, konsum me i ulet, me rezistente
Por me shume $/GB (ndermjet diskut dhe DRAM)
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 11/42
Tipet e flashit
Flash NOR : qeliza e bitit si nje porte NOR
Akseset read/write jane random
Perdoret si memorie e instruksioneve ne sistemetembedded
Flash NAND : qeliza e bitit si nje porte NAND
Dendesitet me i larte (bit/sip.), por akses nje bllok ne kohe Me e lire per GB
Perdoret per memorie, si storage per paisje te ndryshme,…
Bitet e flashit demtohen mbas nje numri te caktuar aksesesh Jo e pershtatshme per RAM
Wear leveling: i zhvendos te dhenat ne blloqet me pak teperdorura
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 12/42
Nderlidhja e komponenteve
Ka nevoje per nderlidhje midis CPU-se, memories, kontrollerave I/O
Bus: kanal komunikimi i perbashket Nje grup linjash paralele qe sherbejne per te
dhena dhe per sinkronizimin e transferimeve Mund te kthehet ne bottleneck
Performanca kufizohet nga faktore fizike Gjatesia e linjes, numri i lidhjeve
Alternativa e fundit: lidhje seriale mecelesa me shpejtesi te larte Si rrjetat e kompjuterave
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 13/42
Tipet e buseve
Busi Procesor-Memorie I Shkurter, me shpejtesi te larte
Projektimi perputhet me organizimin ememoires
Buset I/O
Me te gjate, lejojne lidhje te shumfishta
Specifikohen nga standarte per
interoperatibilitetin
Lidhen me busin procesor memorie nepermjetnje “ure”
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 14/42
Sinjalet ne bus dhe sinkronizimi
Linjat e te dhenave Mbajne adresa dhe te dhena
Te multipleksuara ose te ndara
Linjat e kontrollit Percaktojne tipin e te dhenave, sinkronizojne
transaksionet
Sinkron
Perdor nje sinjal ore per busin Asinkron
Perdor linjat e kontrollit REQ/ACK per te kryerkoordinimin (handshaking)
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 15/42
Shembuj busesh I/O
Firewire USB 2.0 PCI Express Serial ATA Serial
AttachedSCSI
Perdorimi I jashtem I jashtem I brendshem I brendshem I jashtem
Paisje perkanal
63 127 1 1 4
Gjersia ekom.
4 2 2/lane 4 4
Bandwidthmax.
50MB/s ose100MB/s
0.2MB/s,1.5MB/s, ose60MB/s, ose625 MB/s
250MB/s/lane1×, 2×, 4×,8×, 16×, 32×
300MB/s ose375 MB/s,ose 750 MB/s
300MB/s
Hotpluggable
Po Po Varet Po Po
Gjat. Max. 4.5m 5m 0.5m 1m 8m
Standarti IEEE 1394 USBImplementers
Forum
PCI-SIG SATA-IO INCITS TCT10
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 16/42
Sistemi I/O ne PC x86
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 17/42
Menaxhimi i I/O
I/O menaxhohen nga SO Programe te shumta ndajne burimet I/O
Ka nevoje per mbrojtje dhe renditje te akseseve
I/O shkaktojne interrupte asinkrone
I njejti mekanizem si perjashtimet
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 18/42
Komandat I/O
Paisjet I/O menaxhohen nga kontrollleri Transferon te dhena nga/drejt paisjes
Sinkronizon veprimet me software-in
Regjistrat e komandes Shkaktojne kryerjen e nje detyre nga paisja
Regjistrat e gjendjes Tregon se cfare po ben paisja dhe nese ka ndonje
gabim apo jo
Regjistrat e te dhenave Shkrim: transferon te dhenat tek paisja
Lexim: transferon te dhenat nga paisja
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 19/42
I/O Register Mapping Paisje te lidhura me memorien (Memory mapped
I/O) Regjistrat adresohen ne te njejten hapsire si
memoria
Dekoderi i adreses ben dallimin
SO perdor mekanizmat e perkthimit te adresesper ti bere ato te aksesueshme vetem nga kerneli
Instruksione I/O
Instruksione te vecante per aksesimin eregjistrave I/O
Mund te ekzekutohen vetem ne menyren kernel
Shembull: x86
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 20/42
Polling
Periodikisht kontrollohet regjistri i gjendjesse I/O
Nese paisja eshte gati, kryet operacioni
Nese ka gabim, merren masa
E zakonshme ne sisteme embedded tevogla dhe me performance te ulet
Kohet e parashikueshme
Kosto e HW e ulet
Ne sisteme te tjere, humbet koha e CPU
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 21/42
Interruptet
Kur paisja eshte gati ose ndodh nje gabim Kontrolleri ngre nje interrupt ndaj CPU
Interrupti eshte si nje perjashtim Por jo i sinkronizuar ne lidhje me ekzekutimin
e instruksionit Mund te thirret menaxheri ndermjet
instruksioneve Informacioni i shakkut shpesh identifikon
paisjen
Interrupte me prioritet Paisje qe kerkojne vemendje me te larte
marrin prioritet me te larte
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 22/42
Transferimi i te dhenave nga I/O
Paisjet I/O qe punojne me polling ose interrupte
CPU transferon te dhena midis memories dhepaisjes I/O
Nje proces qe konsumon shume kohe per paisjet
e shpejta Direct memory access (DMA)
SO jep adresen e fillimit te memories
Kontrolleri I/O transferon nga/drejt memories ne
menyre autonome
Kontrolleri ngre nje interrupt ne perfundim ose nerast gabimi
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 23/42
Nderveprimi DMA/Cache
Nese DMA shkruan ne nje bllok te memories qeeshte ne Cache
Kopja ne Cache behet e paperdorshme
Nese Cache me politiken wite-back ka nje bllok
“dirty”, dhe DMA lexon ate bllok nga memoria Lexon te dhena te vjeteruara
Duhet te sigurojme koherencen e cache-se
Shkarkkoi blloqet nga cache nese do te perdoren perDMA
Ose perdor per I/O blloqe memorie qe nuk mund tehidhen ne Cache
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 24/42
Nderveprimi DMA/MV
SO perdor adresat virtuale per memorien Blloqet DMA mund te mos jene ne adresa
fizike te njespasnjeshme
Duhet DMA te perdore adresa virtuale? Duhet qe kontrolleri me perpara te beje
perkthimin
Nese DMA perdor adrese fizike Duhet te ndaje transferimet ne pjese me
madhesine e nje faqeje
Ose te lidhe transferime te ndryshme
Ose te alokohen faqe te vazhdueshme fizike
per DMA
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 25/42
Matja e performances I/O
Performanca e I/O varet nga
Hardware: CPU, memoria, kontrollerat, buset
Software: sistemi operativ, sistemi i menaxhimit tebazes se te dhenave, aplikacioni
Ngarkesa e punes: frekuenca e kerkesave dhetipi
Projektimi i sistemit I/O duhet te marre parasysh dymetrika: koha epergjigjes dhe throughput
Matjet e throughputit mund te behen me nje kohepergjigje te kufizuar
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 26/42
Performanca I/O vs. CPU Ligji Amdahlit
Nuk duhet nenvleresuar performanca e sistemitI/O per sa kohe qe paralelizmi rrit performancen eperpunimit
Shembull
Nje benchmark kerkon 90s kohe CPU, 10s koheI/O Dyfishimi i nurmit te CPU-ve/2 vjet
I/O e pandryshuarViti Koha CPU Koha I/O Koha e
nevojshme
% Koha I/O
tani 90s 10s 100s 10%
+2 45s 10s 55s 18%
+4 23s 10s 33s 31%
+6 11s 10s 21s 47%
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 27/42
RAID Redundant Array of Inexpensive (Independent)
Disks Perdor disa disqe te vegjel (c.f. one large disk) Paralelizmi rrit performancen Disqe ekstra per te ruajtur informacion
kontrolli Krijon nje sistem ruajtje tolerant ndaj deshtimit
Vecanterisht nese disqet qe deshtojne mundte zevendesohen automatikisht (“hotswapped”)
RAID 0 Jo redundance (“Ndihme”?)
Thjesht shperndan te dhenat ne disa disqe
Por permireson performancen
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 28/42
RAID 1 & 2
RAID 1: Pasqyrimi(Mirroring)
N + N disqe, replikim i te dhenave
Shkruhen te dhenat si tek disku i informacionitashtu edhe tek ai pasqyre
Ne rast te deshtimit te nje disku lexo nga pasqyra
RAID 2: Error correcting code (ECC)
N + E disqe (p.sh., 10 + 4)
Ndahen te dhenat ne nivel biti ne N disqe Gjenero informacion ECC me E-bit
Shume kompleks, nuk perdoret ne praktike
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 29/42
ne nivel biti
N + 1 disqe
Te dhenat shperndahen ne N disqe ne nivelbyte
Disku shtese ruan informacionin e paritetit
Leximet
Lexo te gjitha disqet
Shkrimet
Gjenero paritetin e ri dhe update te gjitha disqet Ne rast deshtimi
Perdor paritetin per te rindertuar te dhenat ehumbura
Nuk erdoret shume
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 30/42
ne nivel blloku
N + 1 disqe
Te dhenat shperndahen ne N disqe ne nivel blloku
Disku shtese ruan paritetin e blloqe
Leximi
Lexohet vetem disku qe ka bllokun e kerkuar Shkrimi
Lexohet disku qe permban bllokun e modifikuar dhe disku iparitetit
Llogaritet pariteti i ri, shkruhen disku i te dhenave dhe disku i
paritetit
Ne rast deshtimi Perdor paritetin per te rindertuar te dhenat
Nuk perdoret gjeresisht
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 31/42
RAID 3 vs RAID 4
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 32/42
RAID 5: Pariteti i shperndare N + 1 disqe
Si RAID 4, por blloqet e paritetit jane teshperndara ne disqe te ndryshme Shmang mundesine qe disku i paritetit te behet
faktor bllokues
Perdoret gjeresisht
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 33/42
RAID 6: Redundanca P + Q
N + 2 disqe
Si RAID 5, por me shume paritet
Me teper tolerance ndaj deshtimit duke rriturredundancen
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 34/42
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 35/42
Projektimi i sistemit I/O
Kenaqja e kerkesave ne vonese
Per operacione ne kohe reale
Maksimizimi i throughputit
Gjej “lidhjen me te dobet” (lowest-bandwidth)
Konfiguroje per te vepruar me bandwidth maksimal Balanco komponentet e mbetur ne sistem
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 36/42
Kompjuterat Server
Aplikacionet gjithnje e meshumeekzekutohen ne servera
Web search, office apps, virtual worlds, …
Kjo kerkon dhoma te medha kuperqendrohen shume komp. Server
Disa procesore, lidhje ne rrjet, vendruajtjemasive e te dhenave
Kufizime ne hapsire dhe ne fuqi
Paisjet server te ndertuara per “rack” 19”racks
Lartesia shumefish i 1.75” (1U)
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 37/42
Rack-Mounted Servers
Sun Fire x4150 1U server
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 38/42
Sun Fire x4150 1U server
4berthama
secili
16 x 4GB =64GB DRAM
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 39/42
I/O
Sistemi Sun Fire x4150 Ngarkesa: Lexime 64KB
Cdo operacion I/O kerkon 200,000 instruksione perdoruesdhe 100,000 instruksione te SO
Cdo CPU: 109 instruksione/sec
FSB: 10.6 GB/sec max. DRAM DDR2 667MHz: 5.336 GB/sec
PCI-E 8× bus: 8 × 250MB/sec = 2GB/sec
Disqet: 15,000 rpm, 2.9ms avg. seek time, 112MB/sec
transfer rate Cfare shpejtesie komunikimi me I/O mund te
realizohet? Per lexime random dhe per lexime sekuenciale
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 40/42
Shembull projektimi(vazhd)
Shpejtesia e op. I/O per CPU-te
Per berthame: 109/(100,000 + 200,000) = 3,333
8 berthama: 26,667 op/sec
Lexime random, shpejtasia I/O per disqet
Supozojme “seek time” eshte mesatarja/4 Koha/op = seek + latency + transfer
= 2.9ms/4 + 4ms/2 + 64KB/(112MB/s) = 3.3ms
303 op/sec per disk, 2424 op/sec per 8 disqe
Leximet sekuenciale 112MB/s / 64KB = 1750 op/sec per disk
14,000 op/sec per 8 disqe
S ( )
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 41/42
Shembull projektimi(vazhd)
Shpejtesia I/O per PCI-E 2GB/sec / 64KB = 31,250 op/sec
Shpejtesia I/O per DRAM 5.336 GB/sec / 64KB = 83,375 op/sec
Shpejtesia I/O per FSB Supozojme se mund te mbeshtesim gjysmen e
shpejtesise max.
5.3 GB/sec / 64KB = 81,540 op/sec per FSB
163,080 op/sec for 2 FSB
Pika me e dobet: disqet 2424 op/sec random, 14,000 op/sec sekuenciale
P f di
7/17/2019 Leksioni IX Arkiteture Kompjuteri
http://slidepdf.com/reader/full/leksioni-ix-arkiteture-kompjuteri 42/42
Perfundime
Matja e performances Throughput, response time
Siguria dhe kosto eshte e rendesishme
Buset perdoren per te lidhur CPU,
memorien, kontrollerat I/O Polling, interrupte, DMA
RAID
Permiresojne performancen dhe sigurine
Recommended