Upload
erminio-falcone
View
222
Download
0
Embed Size (px)
Citation preview
Sistemi Distribuiti
AA 2004/2005
Prof. Roberto BaldoniIng. Sara Tucci PiergiovanniIng Alessia Milani
Una definizione
Un sistema distribuito è costituito da un insieme di computers spazialmente separati dove sono dislocati componenti hardware e software che comunicano e coordinano tra loro le loro azioni attraverso scambio di messaggi
Obiettivo primario: Condivisione dati/risorse Condivisione dei dati come in
database distribuiti. In questo modo più organizzazioni possono condividere i propri dati.
Problemi: esempio sincronizzazione e coordinamento
Conseguenze
nei sistemi distribuiti le precedenti tecniche devono essere implementate tenendo presente:
1. Concorrenza spaziale oltre che temporale
2. No clock globale
3. Guasti indipendenti
Esempi di sistemi distribuito
inte
rnet
intr
anet
sist
ema
mob
ile
Ma anche.....ExtranetsOverlay NetworksGridUbiquitous Computing
Caratteristiche..e Sfide Eterogeneità Openess Sicurezza Scalabilità Gestione dei guasti Concorrenza Trasparenza
Eterogeneità Networks Hardware Operating Systems Programming Languages Implementations from different Developers
Soluzioni Middleware Mobile code and Virtual Machine
Openess Caratteristica di un sistema di essere esteso e re-
implementato Condizione necessaria documentazione e specifica delle
interfacce software chiave dei componenti di un sistema Interface Definition Language (descrive la sintassi di un
servizio/componente, funzioni disponibili, parametri di input/output eccezioni etc)
Problema: descrizione semantica di un servizio. Descrizioni normalmente date in linguaggio naturale. Eccezioni: web services
La Specifica di un componente/servizio si dice propria se è: Completa. Una specifica è completa se ogni cosa necessaria ad una
implementazione è stata specificata. Se una specifica non è completa l’implementatore deve aggiungere dettagli di specifica che a quel punto dipendono dall’implementazione.
Neutrale. Una specifica e’ neutrale se non offre alcun dettaglio su una possibile implementazione
Openess (ii) Interoperabilità. La capacità di due implementazioni di
sistemi diversi a cooperare usando servizi/componenti specificati da uno standard comune
Portabilità. La capacità di un servizio/componente implementato su un sistema distribuito A, di essere eseguito senza modifiche su un sistema B.
Flessibilità. La capacità di un sistema di configurare/orchestrare componenti da diversi sviluppatori
Estendibilità. La capacità di un sistema distribuito di aggiungere componenti servizi e di essere integrati nel sistema distribuito già in esercizio.
Openess (iii) Altre qualità più recenti:
Evolvability. La capacità di un sistema distribuito di evolvere nel tempo per esempio fare convivere differenti versioni di uno stesso servizio.
Self-* (self organization, self management, self healing etc). La capacità di un sistema distribuito di autoconfigurarsi, auto curarsi etc. senza l’intervento umano.
Il numero a volte elevatissimo (a volte ordine di decine di migliaia) di sviluppatori di software indipendenti rende lo sviluppo di una piattaforma distribuita un lavoro molto complesso e difficile da gestire
Esempi: RFC per internet JBoss per le piattaforme J2EE
Sicurezza Confidenzialità (protezione contro l’intercettazione di dati da parte di
individui non autorizzati)
Integrity (protezione contro l’alterazione di dati)
Availability (protezione contro l’interferenza nell’accesso ad una risorsa)
Scalabilità Un sistema è scalabile se rimane operativo con adeguate prestazioni
anche se il numero di risorse e di utenti aumenta sensibilmente La centralizzazione è contro la scalabilità:
Servizi (singolo servizio per tutti gli utenti) Dati (singola tabella per tutti gli utenti) Algoritmi (fare routing basato su informazioni complete)
Date Computers Web servers
1979, Dec. 188 0
1989, July 130,000 0
1999, July 56,218,000 5,560,866
Computers connected to the internet
Scalabilità (ii) Necessario l’uso di:
Replicazione Servizi Problemi di coordinamento
Replicazione Dati Problemi di consistenza
Algoritmi Distribuiti Nessuna macchina ha lo stato del sistema completo Le macchine basano le loro decisioni solo sui dati in loro possesso Il guasto di una macchina non danneggia l’algoritmo Non c’e’ sincronizzazione tra le macchine
Scalabilità Geografica Implementazioni di servizi/componenti possono essere influenzati da dove saranno fisicamente localizzati i componenti del sistema distribuito.
Comunicazioni sincrone vs comunicazioni asincrone (e.g. eventi)
Scalabilità (iii) Il progetto di un sistema scalabile presenta quattro principali problemi:
Estendibilità del sistema Aggiungere server al volo
Controllare le perdite di prestazioni Usare algoritmi che non richiedono di dialogare con tutto il set di user di un sistema distribuito Usare algoritmi che non richiedono di accedere all’intero set di dati
Prevenire che finiscano le risorse software del sistema Indirizzi IP
Evitare i colli di bottiglia nel sistema Centralizzato vs distributed DNS
Da notare che per motivi di sicurezza l’uso di server centralizzati a volte può essere inevitabile.
Gestione dei Guasti Scoperta dei guasti
Esempio: Checksum per scoprire pacchetti corrotti Mascheramento dei guasti
Esempio: Ritrasmissione sui canali Tolleranza ai guasti
Esempio: intrusion tolerant system Recupero da guasti
Esempio: completamento di long running computation Ridondanza
Esempio: DNS
Concorrenza
Accesso multiplo a risorse condivise Se clienti accedono metodi di read e write di una variabile condivisa Che valori ritornano le read?
Coordinamento Sincronizzazione
Trasparenza Accesso: permette di accedere a risorse locali e remote con le stesse modalità Locazione: permettere di accedere alle risorse senza conoscerne la locazione Concorrenza: permette ad un insieme di processi di operare concorrentemente su
risorse condivise senza interferire tra loro Guasti: permette il mascheramento dei guasti in modo che gli utenti possano
completare le operazioni richieste anche se occorrono guasti hw e/o sw Mobilità: permette di spostare risorse senza influenzare le operazioni utente Prestazioni: permette di riconfigurare il sistema al variare del carico Scalabilità: permette al sistema e alle applicazioni di espandersi in modo scalabile
senza modificare la struttura del sistema e degli algoritmi applicativi
Le prestazioni di una soluzione basata su sistema distribuito non sempre migliorano rispetto ad una basata su sistema centralizzato. Il middleware, necessario per fornire servizi che sfruttano le caratteristiche di un sistema distribuito, in generale può diminuire le prestazioni
Stratificazione hw e sw
Modelli di interazione
client/server peer-to-peer
Modelli di interazione La scelta del modello di interazione impatta su
scalabilità, disponibilità, costo, sicurezza, prestazioni Es. client/server con servizio replicato:
Affidabilità, Scalabilità
Prestazioni: la replicazione impone un lavoro extra per: mantenere la consistenza delle repliche, gestione dei guasti
Web proxy server
Client
Proxy
Web
server
Web
server
serverClient
Web appletsa) client request results in the downloading of applet code
Web server
ClientWeb serverApplet
Applet code
Client
b) client interacts with the applet
Thin clients and compute servers
ThinClient
ApplicationProcess
Network computer or PCCompute server
network
Spontaneous networking in a hotel
Internet
gateway
PDA
service
Music service
serviceDiscovery
Alarm
Camera
Guestsdevices
LaptopTV/PC
Hotel wirelessnetwork
Real-time ordering of eventssend
receive
send
receive
m1 m2
2
1
3
4X
Y
Z
Physical time
Am3
receive receive
send
receive receive receivet1 t2 t3
receive
receive
m2
m1
Processes and channels
process p process q
Communication channel
send
Outgoing message buffer Incoming message buffer
receivem
Middleware: problemi da affrontare Eterogeneità: OS, velocità dei clock, rappresentazione dei dati, memoria,
architettura hw Asincronia locale: anche se i clock fossero gli stessi, il carico (diverso per ogni
nodo), le diverse configurazioni di OS, e gli interrupt creano schedulazioni diverse dei processi in esecuzione (nondeterminismo)
Mancanza di conoscenza globale: la conoscenza si propaga attraverso messaggi i cui tempi di propagazione sono MOLTO più lenti degli eventi interni.
Asincronia di rete: i tempi di propagazione dei messaggi potrebbero essere impredicibili.
Guasti di nodi e/o parti di rete Sicurezza: nei sistemi centralizzati non si espone informazione al mondo esterno
attraverso comunicazioni. Mancanza di un ordinamento globale degli eventi
CIO’ LIMITA L’INSIEME dei problemi computazionalmente risolvibili (algoritmi deterministici) su alcuni SISTEMI DISTRIBUITI