Procesos y Procesadores en Sistemas Distribuidos M.C. Juan Carlos Olivares Rojas [email protected] jcolivar

Procesos y Procesadores en Sistemas Distribuidos

M.C. Juan Carlos Olivares Rojas

[email protected]://antares.itmorelia.edu.mx/~jcolivar

Julio, 2009

mailto:[email protected]

http://antares.itmorelia.edu.mx/~jcolivar

Agenda• 3.1 Procesos y procesadores conceptos

básicos.

• 3.2 Hilos y multihilos. • 3.3 Modelos de procesadores. • 3.4 Asignación de procesadores. • 3.5 Coplanificación. • 3.6 Tolerancia a fallos. • 3.7 Sistemas distribuidos de tiempo real.

Procesos• Un proceso es un programa en ejecución.

• Todos los procesos tienen asociados un espacio de direcciones en memoria, registros y el contador de programas.

• Un programa para poderse ejecutar necesita estar en memoria principal.

• Los procesos son dependientes del sistema operativo.

Procesos• El espacio de direcciones se compone

además de direcciones para almacenar datos, código, la pila y el heap (montículo).

• Toda la información de los procesos en los SOs se guardan el PCB (Process Control Block) que es un arreglo o lista ligada que indica la descripción de cada uno de los procesos.

Procesos• Los procesos tienen asignados un

identificador de procesos (PID), el cual es la forma en que el SO trabaja con los procesos.

• La finalidad del administrador de procesos es realizar una buena administración (planificación) del tiempo de CPU.

• Los procesos presentan tres estados básicos: Ejecución, Listo y Bloqueado.

Ejecución de un Proceso

Lista de Procesos

Procesos• Un proceso está en ejecución cuando

tiene acceso real al tiempo de CPU.

• Un proceso está listo cuando se puede ejecutar, es decir, por algún motivo se suspendió para dejar ejecutar otro proceso

• Un proceso está bloqueado cuando está en espera de algún recurso (E/S) o de que ocurra un evento.

Procesos

Procesos• Estos procesos pueden trabajar de

manera cooperativa para la resolución de un problema muy particular. Para ello necesitan comunicarse entre sí y a lo que a nivel de SO se llama IPC (Inter Process Communication).

• La parte más importante de la comunicación entre procesos es sin duda la transferencia de mensajes entre los diversos procesos.

IPC• La transferencia de mensajes puede

llevarse acabo en base a dos primitivas, enviar y recibir, que se pueden aplicar a casi cualquier recurso como a los archivos (leer y escribir).

• La comunicación entre procesos IPC se debe dar a través del kernel del Sistema Operativo.

Procesador• Un procesador o mejor conocido como

microprocesador es la unidad de hardware que se encarga de procesar los datos que están almacenados en una computadora para producir cualquier tipo de información de interés para los usuarios.

• Un microprocesador se compone de una Unidad Lógica-Aritmética (ALU) que se encarga de las operaciones básicas dadas a través de microprogramación.

Procesador• También se compone de una unidad de

control encargada de la sincronización de todas las operaciones y de áreas de almacenamiento principal llamadas registros y memoria caché.

• La problemática principal es que existe una confusión muy amplia entre lo que es un sistema distribuido, un sistema multiprocesamiento, un sistema paralelo, etc.

Clasificación de SD• Una de las clasificaciones más aceptadas

es la de Flynn, la cual se basa en dos características esenciales: el número de flujos de instrucciones y el número de flujo de datos. La clasificación es la siguiente:

• Una computadora con un sólo flujo de instrucciones y un flujo de datos (SISD, Single Instruction Single Data). Computadoras con monoprocesador.

Clasificación de SD• Computadoras con un flujo de

instrucciones y varios flujos de datos (SIMD, Single Instruction Multiple Data). Procesadores vectoriales.

• Computadoras con múltiples flujos de instrucciones y varios flujos de datos (MIMD, Multiple Instruction Multiple Data). Concepto de SD (no implementada como tal)

Clasificación SD• Los sistemas MIMD se subdividen en dos

grupos:

• Máquinas multiprocesadores. Existe un espacio de direcciones virtuales, compartido por todos los CPU del sistema.

• Sistemas multicomputadoras. Cada máquina tiene su propia memoria en particular.

Clasificación SD• Las categorías anteriores puede

clasificarse de acuerdo a la red de comunicación con la que se interconectan los CPU, en las siguientes categorías:

• Tecnología de bus• La tecnología de conmutador

Otras clasificaciones de SD• En todos los sistemas de equipo de

cómputo, algunas máquinas están fuertemente acopladas, mientras que otras están débilmente acopladas.

• A continuación se muestran cuatro categorías de sistemas de cómputo, en base al acoplamiento y tipo de conexión.

Otras clasificaciones de SD• Multiprocesadores con base en buses.

• Multiprocesadores con conmutador.

• Multicomputadoras con base en buses.

• Multicomputadoras con conmutador.

Otras clasificaciones de SD• En base al acoplamiento del software con

el hardware los SD se dividen en:• Software débilmente acoplado en

hardware débilmente acoplado. LAN • Software fuertemente acoplado en

hardware débilmente acoplado (multicomputadoras). SD

• Software fuertemente acoplado en hardware fuertemente acoplado. Sistemas Tiempo Compartido y Servidores Dedicados.

Cómputo Distribuido• La distribución del cómputo puede

realizarse de diversas formas de acuerdo a su grado de acoplamiento en: – Fuertemente acopladas: Multiprocesadores

(memoria compartida). UMA (Uniform Memory Acces)

– Débilmente acopladas: Multicomputadoras (memoria privada). NUMA (Non Uniform Memory Access)

Sistemas multiprocesadores• Son sistemas que tienen dos o más

procesadores (CPU), comparten las misma memoria (espacio de direcciones).

• Los sistemas multinúcleos es la nueva tendencia en el desarrollo de sistemas multiprocesadores. En un solo chip se tienen varios procesadores (no es nada nuevo bajo el sol).

Tarjeta madre

Tarjeta madre

Sistemas multiprocesadores

CPU 1 CPU nCPU 2

Memoria

Modelo de n procesadores

CPU

N1 Nn

Memoria

Modelo de n núcleos

…

…

Sistemas multicomputadoras• Son sistemas donde cada unidad de

proceso es autónoma e independiente de las demás pero trabajan de manera conjunta.

• La interconexión de unidades de proceso se hace a través de redes de computadora de preferencia de altas velocidades.

• Este es el concepto más estandarizado de un SD.


básicos.

• 3.2 Hilos y multihilos. • 3.3 Modelos de procesadores. • 3.4 Asignación de procesadores. • 3.5 Coplanificación. • 3.6 Tolerancia a fallos. • 3.7 Sistemas distribuidos de tiempo real.

Concurrencia• El término concurrencia indica que se

tienen dos o más procesos al mismo tiempo en el mismo lugar; esto no implica que se estén ejecutando al mismo tiempo (paralelismo).

• El término concurrencia se ha utilizado para indicar que se ejecutan dos o más actividades quasi-paralelamente. En sistemas monoprocesadores esto se logra a través de esquemas de multitarea real y cooperativa.

“Granularidad” del paralelismo• Cuando queremos explotar el

paralelismo, podemos hacerlo en niveles de detalle distintos:– Instrucciones de máquina– Sentencias de un lenguaje de programación– Módulos dentro de un programa– Programas ejecutables completos

• Grano fino grano grueso

28

“Granularidad” del paralelismo• El programador debe saber con qué “grano” debe

trabajar ante cada problema y no trabajar en niveles de detalle inferior.

• Ej. si trabajamos con Ada o Java, estamos en el nivel de “módulos”:– Concurrencia basada en hilos (threads)– no deberíamos perder el tiempo buscando sentencias

simples que se pueden ejecutar en paralelo crear un hilo nuevo para ejecutar una única instrucción no hace ganar tiempo, incluso puede tardar más.

29

¿Dónde se encuentra la concurrencia?

• En el hardware (la herramienta para construir sistemas informáticos):– ejecución paralela de instrucciones– funcionamiento paralelo de los periféricos– procesadores múltiples– sistemas distribuidos

• En la Naturaleza (los sistemas que modelamos cuando hacemos ingeniería de software)– ¿ejemplos?

30

Concurrencia inherente o potencial

• Concurrencia inherente:– Hay sistemas que en los que forzosamente se

dan actividades simultáneas.– p.ej. GUI; red de cajeros automáticos; etc.

• Concurrencia potencial:– Hay sistemas o problemas que se pueden

resolver de forma secuencial, pero en los que se puede aprovechar la concurrencia p.ej. para aumentar el rendimiento.

– P.ej. multiplicar dos matrices, ordenar un vector…

Concurrencia Unix• Los subprocesos se crean con fork()

#include <sys/types.h>pid_t pid; pid = fork()

• Se pueden copiar procesos con la familia de funciones exec.

fork()if (pid == -1) perror(“Error al crear proceso”);else{ if (pid == 0) /*Proceso hijo*/ else /*Proceso padre*/}

Procesos Padre e Hijos

Terminación de procesos• Cuando un proceso termina devuelve un valor

de retorno al proceso padre.

• Todos los procesos tienen un proceso padre. Este código de retorno puede ser consultado a través de la variable de entorno $?

• La forma más fácil de salir es devolver un código de retorno (e.g., return 0).

Terminación de procesos• Otra forma de salir es a través de exit(),

realiza aparentemente el mismo comportamiento, ayuda a desbloquear procesos en espera.

• La función atexit() permite definir una función que se ejecutará al finalizar un programa.

Terminación de procesos• A el código de estado de un proceso

formalmente se llama señal.

• Un proceso huérfano es aquel que se ha quedado sin padre.

• Un proceso zombi es aquel que se ha quedado ocupando una posición de la tabla de descriptor de procesos.

wait()• En algunas ocasiones un proceso padre

necesita esperar a que sus hijos termine. Para ello necesita sincronizarse los procesos.

• La función que nos permite parar un proceso hasta que termine otro es wait

• pid = wait(&estado);

wait()• Algunas macros que nos ayudan en este

proceso son:

• WIFEXITED• WEXITSTATUS• WIFSIGNALED• WTERMSIG• WCOREDUMP

Más sobre procesos• Un ejemplo de clonación de procesos es

la ejecución de la función system() que nos permite ejecutar una llamada al sistema, generalmente un comando de la shell.

• hijo = getpid();• Padre = getppid();• Grupo = getpgrp();

Identificadores de usuario y de grupo

• En muchas ocasiones no sólo es necesario conocer los identificadores de procesos sino conocer los usuarios y los grupos.

• uid_t getuid(); /*usuario real*/• uid_t geteuid(); /*usuario extendido*/• gid_t getgid();• gid_t getegid();

Variables de entorno• En algunos casos es necesario compartir

algunos valores entre aplicaciones, esto se puede hacer a través de la variable de entorno.

• Las variables de entorno pueden verse con el comando env (ambiente). Muchos comandos muestran información a través de este entorno.

Variables de entorno• Hay algunas variables disponibles en la

mayoría de los sistemas como HOME, SHELL, TERM, PATH.

• Pueden accederse de manera individual haciendo eco en la pantalla con echo.

• char *valor = getenv(“TERM”);

Variables de entorno• char *var1 = “VARIABLE=valor”• putenv(var1); /*Coloca una variable en el

entorno*/

• La función sleep() permite dormir un proceso una cantidad determinada de milisegundos.

Señales

• Definidas en <signal.h>

• 1 SIGHUP• 2 SIGINT• 3 SIGQUIT• 4 SIGILL• 5 SIGTRAP• 6 SIGIOT• 7 SIGEMT• 8 SIGFPE• 9 SIGKILL

• 10 SIGBUS• 11 SIGSEGV• 12 SIGSYS• 13 SIGPIPE• 14 SIGALARM• 15 SIGTERM• 16 SIGUSR1• 17 SIGUSR2• 18 SIGCLD• 19 SIGPWR

Señales• int kill(pid, sig) sirve para mandar una

señal de un proceso a otro.

• pid > 0 proceso; pid = 0 a todos los procesos que pertenecen al mismo grupo.

• La función signal sirve para capturar una señal y realizar una función con ella.

Señalesmain() { void sigint_handler();if(signal(SIGINT,sigint_handler)== SIG_ERR) perror(“Error en la señal”);……..}

void sigint_handler(int sig) { printf(“señal recibida”);}

Hilos• Son procesos ligeros ya que no se

duplican completamente, sólo duplican su segmento de código. Por tal motivo, comparten datos fácilmente, la desventaja es que ocurren muchos problemas del tipo “race conditions”, pero al igual que IPC se soluciona con mecanismos como regiones críticas, zonas de exclusión mutua, etc.

Hilos• Los hilos son procesos ligeros a diferencia

de los procesos hijos, los hilos sólo replican el segmento de código, por lo que comparten datos entre otros hilos haciendo mejor uso de la memoria.

• La problemática con los hilos es que cada sistema operativo implementa sus hilos de manera distinta. Por ejemplo existen los hilos POSIX, los hilos C de Mach, los hilos en Windows, etc.

Threads Implementation

Web Server Process

Hilos• PThreads (POSIX Threads) es la biblioteca

para la creación de hilos más implementada en sistemas *X.

• Se utiliza la biblioteca pthread por lo que algunos compiladores ya la incluyen de manera predeterminada sino habrá que indicar su uso: gcc … -lpthread

Hilos• Crear hilos:int pthread_create(pthread_t *thread,

pthread_attr_t *attr, void * (*start_routine)(void *), void *arg)

• Esperar la finalización de hilos:int pthread_join(pthread_t th, void

**thread_return)

Hilos• No guardar estado del hilo:int pthread_detach(pthread_t h)

• Salir de un hilo:pthread_exit(void *retval)

• Biblioteca a utilizar: #include <pthread.h>

Hilostypedef struct parametros {

int id;char *nombre

};

void *funcion(parametros *p) {printf(“%s %d”, p->cadena, p->id);pthread_exit(&(p->id))

}

Hilos• Referencia asi mismo:Yo = pthread_self(); /*Demás funciones*/

• Enviar una señal a un hilo:pthread_kill(pthread_t hilo, int señal);

• Los hilos no están tan extendidos por que existen muchas variantes: hilos mach, hilos solaris, Gthreads, etc.

Hilos• Mutex:

pthread_mutex_init(pthread_mutex_t *mutex, const pthread_mutex_attr_t *attr)

int pthread_mutex_lock(pthread_mutex_t *mutex) int pthread_mutex_lock(pthread_mutext_t

*mutex)

int pthread_mutext_destroy(pthread_mutext_t *mutex)

Hilos• En general los hilos en Java debido a su

portabilidad binaria son idénticos en todas las plataformas. Existen dos formas básicas de implementar procesos: heredar de la clase Thread o bien implementar la interfaz Runnable.

• En general en el método public void run() se agrega la funcionalidad del hilo.

Hilos• Si se heredo de la clase Thread el hilo

debe crearse de la siguiente forma:

• Thread hilo = new Thread(new Objeto());

• El método Thread.sleep(ms); permite dormir un proceso n cantidad de milisegundos.

Hilos• En general se ejecuta el hilo poniendo el

método start(), e.g.: hilo.start();

• Otros métodos de los hilos son: isAlive() para determinar si un hilo está con vida, el metodo stop()* finaliza un hilo, el método suspend()* lo suspende, el método resume() reanuda un proceso y join() espera a que finalice un proceso especificado.

Hilos• Se pueden asignar prioridades a los hilos

con el método setPriority(), en donde la prioridad puede ser MIN, MAX y NORM_PRIORITY.

• El método yield() cede prioridad, mientras que el método setDaemon(true) hace que un hilo sea demonio.

Hilos• Los demonios son hilos que pueden

correrse sin depender de otros procesos. Se utilizan mucho para la programación de servicios del sistema.

• Se pueden crear grupos de hilos con la clase GroupThread para un mejor manejo.


básicos. • 3.2 Hilos y multihilos. • 3.3 Modelos de procesadores. • 3.4 Asignación de procesadores. • 3.5 Coplanificación. • 3.6 Tolerancia a fallos. • 3.7 Sistemas distribuidos de tiempo real.

Modelos de Procesadores• En un sistema distribuido, con varios

procesadores, un aspecto fundamental del diseño es cómo se los utiliza

• Los procesadores distribuidos se pueden organizar de varias formas:

• Modelo de estación de trabajo. • Modelo de la pila de procesadores. • Modelo híbrido.

3.3 Modelos de Procesadores• 3.3.1 De estación de trabajo.

• 3.3.2 De pila de procesadores.

• 3.3.3 Híbrido.

Modelo de Estación de trabajo• El sistema consta de estaciones de

trabajo (PC) dispersas conectadas entre sí mediante una red de área local (LAN).

• Pueden contar o no con disco rígido en cada una de ellas.

• Los usuarios tienen: – Una cantidad fija de poder de cómputo

exclusiva. – Un alto grado de autonomía para asignar los

recursos de su estación de trabajo.

Modelo de Estación de Trabajo• Uso de los discos en las estaciones de

trabajo:

• Sin disco: • Bajo costo, fácil mantenimiento del

hardware y del software, simetría y flexibilidad.

• Gran uso de la red, los servidores de archivos se pueden convertir en cuellos de botella.

Modelo de Estación de Trabajo• Con disco:

• Disco para paginación y archivos de tipo borrador:

• Reduce la carga de la red respecto del caso anterior.

• Alto costo debido al gran número de discos necesarios.

Modelo de Estación de Trabajo• Los aspectos clave en el uso de las

estaciones de trabajo inactivas son:

• ¿Cómo encontrar una estación de trabajo inactiva?.

• ¿Cómo lograr que un proceso remoto se ejecute de forma transparente?.

• ¿Qué ocurre si regresa el poseedor de la máquina?.

Modelo de Estación de Trabajo• Generalmente se considera que una

estación de trabajo está “inactiva” cuando se dan ambas condiciones:

• Nadie toca el ratón o el teclado durante varios minutos.

• No se ejecuta algún proceso iniciado por el usuario.

Modelo de Estación de Trabajo• Los algoritmos para localizar las

estaciones de trabajo inactivas se pueden dividir en dos categorías: Controlados por el servidor y Controlados por el cliente.

• La localización de estaciones de trabajo en sí no es problemático, el problema radica en la sincronización de procesos entre las diferentes estaciones de trabajo.

Modelo de Pila de Procesadores• Se dispone de un conjunto de cpu que se

pueden asignar dinámicamente a los usuarios según la demanda .

• Los usuarios no disponen de estaciones de trabajo sino de terminales gráficas de alto rendimiento.

• No existe el concepto de propiedad de los procesadores, los que pertenecen a todos y se utilizan compartidamente.

Modelo de Pila de Procesadores• Este modelo basa su funcionamiento en

la teoría de colas.

• En general este modelo puede reducir significativamente el tiempo de espera al tener una sola cola de procesadores a repartir.

• La capacidad de cómputo se puede gestionar de mejor forma si se tiene micros con mayores capacidades.

Modelo Híbrido• Combina las mejores características del

modelo de estación de trabajo y de pila de procesadores teniendo un mejor desempeño en las búsquedas y mejor uso de los recursos.



Asignación de procesadores• Son necesarios algoritmos para decidir cuál

proceso hay que ejecutar y en qué máquina .

• Para el modelo de estaciones de trabajo: • Decidir cuándo ejecutar el proceso de

manera local y cuándo buscar una estación inactiva.

• Para el modelo de la pila de procesadores: • Decidir dónde ejecutar cada nuevo proceso.

3.4 Asignación de Procesadores• 3.4.1 Modelos y algoritmos con sus

aspectos de diseño e implantación.

Modelos de asignación• Generalmente se utilizan las siguientes

hipótesis:

• Todas las máquinas son idénticas (o al menos compatibles en el código); difieren a lo sumo en la velocidad.

• Cada procesador se puede comunicar con los demás.

Modelos de Asignación• Existen dos estrategias de asignación:

• No migratorias: – Una vez colocado un proceso en una máquina

permanece ahí hasta que termina.

• Migratorias: – Un proceso se puede trasladar aunque haya

iniciado su ejecución. – Permiten un mejor balance de la carga pero

son más complejas.

Modelos de Asignación• Los algoritmos de asignación intentan

optimizar:

• Uso de las cpu: – Maximizar el número de ciclos de cpu que se

ejecutan para trabajos de los usuarios. – Minimizar el tiempo de inactividad de las cpu.

• Tiempo promedio de respuesta: – Minimizar no los tiempos individuales de

respuesta sino los tiempos promedio.

Modelos de Asignación• Tasa de respuesta:

– Minimizar la tasa de respuesta, que es el tiempo necesario para ejecutar un proceso en cierta máquina dividido por el tiempo que tardaría en cierto procesador de referencia.

• Los principales aspectos a tomar en cuenta en el diseño de algoritmos de asignación de procesos son los siguientes:

• Algoritmos deterministas vs. heurísticos.

Modelos de Asignación• Algoritmos centralizados vs. distribuidos.

• Algoritmos óptimos vs. subóptimos.

• Algoritmos locales vs. globales.

• Algoritmos iniciados por el emisor vs. iniciados por el receptor.

Modelos de Asignación• En general son muchos aspectos que se

deben considerar para la generación de algoritmos de asignación de procesadores, por ejemplo, que el micro este conciente de su carga de trabajo implica una serie de mediciones que pueden ser realmente inciertas.

• Los algoritmos de asignación en primera instancia deben buscar la estabilidad del sistema.



Planificación de Procesos• La planificación de procesos es la etapa

más importante del administrador de procesos ya que se encarga de administrar la disponibilidad del uso de CPU.

• Los planificadores no importando su complejidad deben respetar los siguientes elementos: equitatividad, eficiencia, tiempo de respuesta, retorno, volumen de producción.

Calendarizador de Procesos

Planificación de Procesos• La problemática con este tipo de

administración es que los recursos son únicos e imprendecibles. Por este motivo el planificador trata de estimar algunas características.

• Un planificador no sabe cuanto tiempo tardará en ejecutarse un proceso y si este en algún momento se bloquea por alguna petición de entrada o de salida.

Planificación de Procesos• Por este motivo un planificador debe de

asignar un tiempo predeterminado llamado Quantum para la ejecución de procesos.

• Un proceso puede ser interrumpido por otro proceso cuando este último requiera de una atención inmediata. Esto da origen a planificadores don prioridades.

Planificación de Procesos• El planificador de procesos se encarga de

mantener el contexto de cada una de las aplicaciones para poder realizar multitarea.

• Existen diverso algoritmos de planificación de tareas:

• El algoritmo de round robin (torneo)• Planificación por prioridad• Colas múltiples

Planificación de Procesos• Primero el trabajo más corto• Planificación garantizada• Planificación por loteria• Planificación por niveles

• En los Sistemas Dstribuidos, generalmente cada micro hace su propio administración local.

Coplanificación• Después de tener un modelo de

procesamiento y de un algoritmo de asignación de procesadores, el siguiente gran reto es la administración conjunta de los tiempos de uso de CPU de los procesos de forma global.

• Para poder realizar esto, se necesita de algoritmos de planificación y métodos de comunicación más eficiente. A continuación se describen algunos algoritmos de coplanificación.

Coplanificación• El algoritmo de Ousterhout toma en

cuenta los patrones de comunicación entre los procesos durante la planificación.Debe garantizar que todos los miembros del grupo se ejecuten al mismo tiempo.

• Se emplea una matriz conceptual donde:Las filas son espacios de tiempo.Las columnas son las tablas de procesos de los procesadores.

Coplanificación• Cada procesador debe utilizar un

algoritmo de planificación Round Robin.

• Todos los procesadores ejecutan el proceso en el espacio “0” durante un cierto período fijo.Todos los procesadores ejecutan el proceso en el espacio “1” durante un cierto período fijo, etc.

Coplanificación• Se deben mantener sincronizados los

intervalos de tiempo.

• Todos los miembros de un grupo se deben colocar en el mismo número de espacio de tiempo pero en procesadores distintos.

• A continuación se describe un cómputo paralelo y coplanificación de procesos

¿Es el cómputo paralelo un sistema distribuido?

• Sí y No. Depende de la implementación.

• Los objetivos de la programación en paralelo de acuerdo con [5] son: – Reducir el tiempo de procesamiento utilizado

por un algoritmo convencional– Reducir la complejidad del algoritmo

• Se trata de aprovechar mejor el hardware.

Cómputo Paralelo

Analogía con el Tráfico de una Autopista

¿Qué se puede lograr con el paralelismo?

Suponer que tenemos un convoy largo de carga: troncos de madera…

Una aplicación no paralelizada

Vamos a dividir en 4 trocas más pequeñas…

Cuatro hilos independientes

Ahora, podemos poner una troca en cada carril…

Explotar los múltiples núcleos…

La carga llega mucho más rápido!

Resultado: Mejora la tasa de trabajos!

97

Analogía con el Tráfico de una Autopista

Planificación del Sistema OperativoPlanificador del SO (Selecciona el carril)

Debe esperar la troca.

El SO piensaCarril 1

1

2

3

4

Carril 2

El Sistema Operativo no puede romper una aplicación en hilos…

… solo puede planificar hilos existentes.

Paralelismo

A B C D

A

B

C

D

P1

P2

P3

P4

Homoparalelismo

A B C D

A

B

C

D

P1

P2

P3

P4

Hetereoparalelismo

Paralelismo• El problema del paralelismo radica en que

muchos algoritmos no pueden paralelizarse (son serializable o secuenciales) [6].

• Existen dos tecnologías para realizar paralelismo:– PVM (Parallel Virtual Machine) [7]– MPI (Message Parking Interface) [8][9][10]

Algoritmo paralelosfor(int i = 0; i < 4; i++){

aleatorio(i); }

aleatorio(1) micro1aleatorio(2) micro2aleatorio(3) micro3aleatorio(4) en espera

• Compilador optimizado. Sistemas Operativos optimizados

Algoritmos paralelos

mnmnmm

n

n

b

b

b

x

x

x

aaa

aaa

aaa

2

1

2

1

21

22221

11211

No conviene

Conviene

Algoritmos paralelos• Instrucciones como while son más

difíciles de paralelizar por que depende de la condición.

• No siempre los compiladores pueden paralelizar de manera automática un algoritmo.

• En algunas ocasiones se invierte más tiempo tratando de paralelizar un algoritmo que ejecutándolo de manera secuencial.


//Procesador unofor( i=0; i<N/2; i++){ a[i]= c+i;}

//Procesador dosfor( ; i<N; i++){ a[i]= c+i;}

//Procesador unofor( i=0; i<N/2; i++){ a[i]= c+i;}

//Procesador dosfor( i = N/2; i<N; i++){ a[i]= c+i;}


A[0] = C;

//Procesador unofor( i=1; i<N/2; i++){ a[i]= a[i-1]+1;}

//Procesador 2for( i=N/2; i<N; i++){ a[i]= a[i-1]+1;}

• ¿Por qué no se puede paralelizar?

• Por que el segundo proceso depende del resultado del primero.

• Si se puede si se encuentra un algoritmo que permita encontrar el valor de a[N/2] directo.

2/N

Ci

i

Caso práctico MPI• Existen diversas implementaciones de

MPI: LAM/MPI, MPICH, MPICH2, OpenMPI

• MPI se puede programar en C o Fortran.

• El primer paso es tener nuestro programa paralelo y asegurarnos de que está corriendo el demonio de MPI:

• mpd –ncpus=procesadores &• mpdtrace -1

Caso Práctico MPI• Se debe compilar el programa:• mpicc holamundo.c –o holamundo

• Se debe de correr el proceso idicando el número de procesadores:

• mpirun –np 10 ./holamnudo

Holamundo.c en MPI#include <stdio.h>#include “mpi.h”int main(int argc, char **argv){ int procesos, rango, tam;

char nombre[MPI_MAX_PROCESSOR_NAME];MPI_Iinit (&argc, &argv);MPI_Comm_size(MPI_COMM_WORLD, &procesos);MPI_Comm_rank(MPI_COMM_WORLD, &rango);MPI_Get_processor_name(nombre, &tam);MPI_barrier(MPI_COMM_WORLD);printf(“Hola, mundo!, soy %d de %d y me ejecuto en:%s\n”, rango, procesos, nombre);MPI_Finalize();return 0;

}

Esquema de un programa en MPI

Esquema de un programa en MPI/*Cabecera de MPI*/#include <mpi.h>int main(int argc, char **argv){

int quiensoy, tamano;MPI_Status estado;/*Inicializamos MPI*/MPI_Init(&argc, &argv);/*Preguntamos quienes somos*/MPI_Comm_rank(MPI_COMM_WORLD, &quiensoy);

/*Nos esperamos hasta quetodos hayan inicializado MPI*/MPI_Barrier(MPI_COMM_WORLD);/*Preguntamos cuanto somos*/MPI_Comm_size(MPI_COMM_WORLD, &tamano);/*PROGRAMA*/

Esquema de un programa en MPIif(quiensoy == root)

{/*Inicialización estrructuras repartidorReparte tareasEspera resultadosVisualiza resultados*/

}else{

/*recibe la tarearealiza cálculosmanda resultados*/

} /*Finaliza el programa*/

MPI_Finalize();exit(0);

}

Paralelización Multiplicación de Matrices

• Programa secuencial de multiplicación de matrices en Java o C.

• Programa concurrente, partir del hecho de que se puede poner un hilo en ejecución para multiplicaciones no dependientes.



Tolerancia a Fallas• La tolerancia a falla en sistemas con

multiprocesamiento puede lograrse a través de una buena sincronización entre procesos (IPC).

• Los IPC de POSIX son: cola de mensajes, tuberías, semáforos y memoria compartida (discutida en la siguiente unidad).

• Los IPC se ejecutan a nivel de kernel y no a nivel de usuario.

Tuberías• Las tuberías nos permiten redireccionar el

flujo de salida de un proceso para ser la entrada de otro.

• A nivel de comandos se puede realizar con el operador | (pipe). Por ejemplo ls –l | more, hace que la salida del comando –ls sea la entrada de more, por lo que se verá pantalla por pantalla la información

Tuberías• Se pueden utilizar tuberías desde los

procesos.

• int pipe(tuberia);• int tuberia[2];

• tuberia[0] • tuberia[1]

Tuberías• Al dejar de utilizar una tubería, esta se

debe de cerrar en sus dos extremos: close(pipe).

• Por un extremo de la tubería se lee, y por el otro se escribe. Ya depende de la lógica del programa ubicar que lado escribe y que lado lee. En general, primero se escribe y luego se lee.

• Se utiliza la biblioteca unistd.h*

Tuberías• Para escribir en una tubería se realiza lo

siguiente: write(tuberia[1], mensaje, strlen(mensaje)+1).

• Para leer: read(tuberia[0], mensaje, MAX)

• Las tuberías no son bidireccionales, sólo van en un sentido, pero se pueden utilizar dos tuberías para pasar mensajes en ambas direcciones.

Tuberías• Las tuberías utilizadas sólo están

disponibles para los descendientes de un proceso que lo crean. Por este motivo, no están disponible para otros procesos.

• Las tuberías entre procesos iguales se les llama sin nombre. El otro tipo de tuberías tienen nombre y generalmente se les llama FIFO.

Tuberías• Las tuberías con nombre se manejan

igual que las tuberías sin nombre con la salvedad de que presentan un nombre que ocupa una entrada de directorio.

• Se trabajan igual que un archivo sólo que se bloquea cuando un proceso escribe en la tubería.

Tuberías• Para crear una tubería con nombre desde

shell se debe ejecutar: mknod fifo_1 p

• Desde programación las tuberías con nombre se crean: mknod(“tubo”, S_IFIFO | permisos, 0)

• Las comunicaciones vistas hasta ahora son half-duplex. Se puede utilizar un poll o select para realizar comunicación full-duplex

Semáforos

• Los semáforos son mecanismos que permiten sincronizar procesos.

• Todos los mecanismos IPC tienen una entrada en una tabla especial con una llave definida por el usuario.

• Los posibles valores de la llave son IPC_PRIVATE, IPC_CREATE, IP_EXECL, entre otros.

Semáforos• Cada entrada de la tabla tiene un registro de

permisos (rw), información de estado y llamadas de control.

• Las llaves son del tipo key_t. Para crear una llave se utiliza:

#include <types.h>#include <sys/ipc.h>key_t ftok(path, id)

Llaveskey_t llave;if((llave= ftok(“/etc/ntp.conf”, ‘A’) ==

(key_t)-1)/*Error al crear la llave*/

• ipcs se utiliza para ver los mecanismos ipc asignados (-q, -m, -s, -b)

• ipcrm se utiliza para liberar recursos (-q msqid, -m shmid, -s semid)

Semáforos• Es un mecanismo para prevenir colisiones

cuando uno o más procesos solicitan simultáneamente un recurso.

• Dijsktra los define como un objeto tipo entero en los cuales se puede aplicar dos operaciones: P (Proberen, comprobar) y V (Verhogen, incrementar), donde P sirve para obtener el recurso y V para liberarlo.

Semáforos• Las operaciones sobre un semáforo son

semget para crear un semáforo o habilitar uno existente, semctl para realizar operaciones de control e inicialización, semop para realizar operaciones P y V.

#include <sys/types.h>#include <sys/ipc.h>#include <sys/sem.h>int semget(key, nsems, semflg)

Semáforosint llave, semid;if((llave= ftok(“auxiliar”, ‘K’)) ==(key_t)-1)

/*Tratamiento del error*/

if((semid= semget(llave, 4, IPC_CREAT | 0600)) == -1)/*Error al crear el semáforo*/

Semáforosint semctl(semid, semnum, cmd, arg)union semun{

int val;struct semid_ds *buf;ushort *array;

}arg;

• Las opciones de control son: GETVAL, SETVAL, GETPID, GETNCNT, GETZCNT, GETALL, SETALL, IPC_STAT, IPC_SET

Semáforosushort asem;asem[0]=5; asem[1]=3; asem[2]=4;

asem[3]=8;semctrl(semid, 0, SETALL, asem)valor = semctrl(semid, 3, GETVAL, 0)

int semop(semid, sops, nsops)struct sembuf *sops;

Semáforos

struct sembuf{ushort sem_num;short sem_op;short sem_flg;

};

• Si semop es negativo se decrementará (P), si se incrementa (V) y si es 0 no hace nada.

• Las banderas son: IPC_WAIT, IPC_NOWAIT, SEM_UNDO

Semáforosstruct sembuf operacines[4];Operaciones[0].semnum = 1;Operaciones[0].sem_op = -1;Operaciones[0].sem_flg = 0;Operaciones[1].semnum = 4;Operaciones[1].sem_op = 1;Operaciones[1].sem_flg = 0;

semop(semid, operaciones, 2);

Colas de mensajes• La filosofía de las colas de mensajes es

similar a las tuberías, pero con mayor versatilidad.

• Una cola es una estructura de datos gestionada por el kernel, en la cual varios procesos pueden escribir sobre ella. El sincronismo para evitar colisión lo realiza el kernel.

Colas de mensajes

#include <sys/msg.h>int msgget(key, msgflg)

If((msqid= msgget(llave, IPC_CREATE | 0600)) == -1)/*Error al crear la cola de mensajes*/

• msgctrl(msq, cmd, buf) sirve para leer y modificar la información estadística y de control de una cola.

Colas de mensajes• Los comandos de control son: IPC_STAT,

IPC_SET, IPC_RMID. Por ejemplo: msgctrl(msqid, IPC_RMID, 0);

• Las operaciones básicas de una cola de mensajes son enviar y recibir los mensajes que se realizan con las siguientes funciones:

int msgsnd(msqid, msgp, msgsz, msgflg);int msgrcv(msqid, msqp, msgtyp, msgflag);

Cola de mensajes• El parámetro msgtyp indica el tipo de

mensaje que se desea leer: 0 para el primer mensaje, > 0 el primer mensaje de tipo msgtyp que haya en la cola, <0 lee el primer mensaje que sea menor o igual al valor absoluto de msgtyp y además sea el mensaje más pequeño de los que hay.

Cola de mensajesstruct{

long tipo;char cadena[20];

}mensaje;

strcpy(mensaje.cadena, “SD1”);mensaje.tipo = 1; longitud = strlen(mensaje.cadena)if(msgsnd(msqid,&mensaje,longitud,0)==-1)

/*Err*/if(msgrcv(msqid,&mensaje,longitud,1,0) ==-1)

/*Er*/



Sistemas de tiempo real• Son sistemas para poder ejecutar

satisfactoriamente tareas que han de completarse en un plazo prefijado de tiempo (ej. sistemas de control industrial, sistemas multimedia, sistemas de misión crítica).

• Se caracterizan porque los procesos tienen que ejecutar en instantes predeterminados.

Clasificación de STR• Existen dos tipos de STR:

• Crítico (rígido): para tareas que siempre deben cumplir los plazos de terminación. Adecuados para la industria. Muy simples, incompatibles con tiempo compartido, memoria virtual, etc.

• No crítico (flexible): intentan cumplir los plazos, pero no los garantizan al 100%. Adecuados para multimedia, etc.

Ejemplo de STR• Aeronave

• Carro

Sistemas Embebidos de TR

Aplicaciones de los STR• Dominio Industrial

– Controlador de la planta– Robot para tratamiento de material peligroso

• Uso militar– Sistema de reconocimiento de blancos

automático– Sistema de guiado de misiles y navegación

• Sistemas altamente críticos– Plantas nucleares– Sistemas de aviónica

Sistemas de Tiempo Real• Los tipos de tiempo pueden ser:

– Los de plazo fijo se ejecutan una vez en un instante determinado.

– Los periódicos se ejecutan cada cierto tiempo.

• Los sistemas en tiempo real críticos tienen asignada una franja de tiempo que no pueden rebasar.

Sistemas de Tiempo Real• Suelen tener pocos procesos en estado

de listo a fin de que no se retrase la ejecución de los mismos.

• Se introducen retardos en la ejecución, como puede ser la memoria virtual, puesto que la paginación puede producir retrasos inadmisibles para el proceso.

• Los STR son altamente tolerante a fallas manejados por el sistema.

Arquitecturas de Tiempo Real

Comunicaciones

Software de Tiempo-Real

MedioAmbiente

E/SDigital

E/SAnalógico

Otras E/S

Reloj

Otras Computadoras

Computadora (HW)

Microcontroladores y sistemas embebidos.DSP’s, PLC’s.Buses de multiprocesadores:VMEBUs,Multibus,FutureBus

Arquitecturas RISC, Transputers.Uniprocesadores, Multiprocesadores.Memorias chache, DMA’s.

Sistema en Tiiempo Real Distribuido. Arqutecturas homogeneas o heterogeneas.Redes de area local, y topologias de red.Protocolos de comunicaciones:Ethernet, Token RingModelo OSI.Redes FFDI, X-25, ATM.

Ejemplo de un sistema en tiempo real.

Actividades en una computadora de automobil.

Control deVelocidad

Control decombustible

Control de Frenado

Otro software no-critico

C=4ms.T=20ms.D=5ms.

C=10ms.T=40ms.D=40ms.

C=40ms.T=80ms.D=80ms.

C=10ms.T=40ms.

C=tiempo de computo (peor caso), T=Periodo de ejecucion, D=Plazo de respuesta

Solucion Ciclica.

velocidadfrenado

com busti ble-1

vel.

combustible-2velocidad

frenado

com busti ble-3

vel.

combustible-2

nocritico

0 4

14

20

24

4044

54

60

64

76

* implica descomponer actividadesgrandes en varias ejecuciones.

Solucion Concurrente.

task body speed isbeginloop speed_measurement; next:=next+0.2 sleep_until_next;end loopend speed

task body non_critical isbeginloop perform computation;end loopend speed

task body brake isbeginloop control_brakes; next:=next+0.2 sleep_until_next;end loopend speed

task body fuel isbeginloop fuel_injection; next:=next+0.2 sleep_until_next;end loopend speed

La solucion concurrente es mas simple de disenar y modificar.

Sistemas Distribuidos de TR• Son totalmente más complejos debido a

la gran heterogeneidad de sus componentes.

• Debido a esta problemática son poco los Sistemas Operativos Distribuidos de Tiempo Real aunque muchos SO de Tiempo Real (ej. SO de dispositivos empotrados) tienen capacidad de comunicación distribuida.

Sistemas Operativos de TR• El problema de la distribución radica en

los tiempos de latencia de los mecanismos de comunicación distribuida (sockets, RPC, middlewares, etc.) dado que no hay una garantía de servicio y más si se enfoca en redes públicas como la Internet.

• En la práctica la gran mayoría de los Sistemas Operativos Distribuidos de Tiempo Real se llegan a implementar en sistemas multiprocesadores.

Sistemas Operativos Distribuidos de TR

• La mayoría de los sistemas operativos distribuidos de tiempo real caen en el área de multimedia (QNX) y de los sistemas empotrados (Symbian). Los sistemas de navegación son otro claro ejemplo de SOTR.

SOD de Tiempo Real• Estos sistemas deben de ser totalmente

determinísticos y predecibles.

• Otro tópico que es un gran reto en este tipo de sistema es la seguridad y en específico el control de acceso.

• El balanceo de cargas de trabajo es de suma importancia para el uso eficiente del sistema

SOD de Tiempo Real• La concurrencia y sincronización de

procesos es aún más complicada (un recurso que es utilizado por un proceso debe de ser liberado automáticamente para que otro proceso más crítico pueda trabajar inmediatamente).

• La selección de hardware es más compleja.

• La caracterización (medición de tiempos) de estos sistemas es compleja y no muy exacta.

SOD de Tiempo Real• El uso de SOD de Tiempo Real tiene que

ser manejado con las aplicaciones, ya que de lo contrario no tendría una utilidad práctica; por este motivo, es necesario la adaptación de herramientas como: compiladores, utilerías, base de datos y software de sistema.

Referencias• Liberty, Jesse, Horvarth, David (200).

Aprendiendo C++ para Linux en 21 Días. México, Prentice Hall.

• Márquez, Francisco (1994). Unix Programación Avanzada. Estados Unidos, Addison-Wesley.

Referencias• Colouris, George, Dollimore, Jean,

Kindberg, Tim (2001). Sistemas Distribuidos Conceptos y Diseño. 3a. Edición. España, Pearson Addison-Wesley.

• Horstmann, Cay, Cornell, Gary (2006). Core Java 2 Volumen II Carácterísticas Avanzadas. España, Perason Prentice Hall.

Referencias• Deitel, Harvey, Deitel, Paul (2004). Java

Como Programar. Quinta Edición. México, Pearson Prentice Hall.

• Márquez, Francisco (2004). UNIX Programación Avanzada. Tercera edición, México, Alfaomega Ra-Ma.

Referencias• Froufe, Agustín, Jorge, Patricia (2004). J2ME Java

2 Micro Edition Manual de usuario y tutorial. México, Alfaomega.

• Firtman, Maximiliano (2004). Programación de celulares con Java. Argentina, MP Ediciones.

• Ruíz, Diego (2005). C# La guía total del programador. Argentina, MP Ediciones.

Referencias• Tanenbaum, Andrew (1996). Sistemas

Operativos Distribuidos. México, Prentice Hall.

• Tanenbaum, Andrew, Van Steen, Maarten (2006). Distributed Systems Principles and Paradigms. Estados Unidos, Pearson Prentice Hall.

• Mejía, P. (2009), Curso de Sistemas de Tiempo Real, CINVESTAV, México.

Referencias• J. Senn, “Análisis y Diseño de Sistemas de

Información”, 2da. Edición, McGraw-Hill, México, 1992, ISBN: 968-422-991-7.

• A. Tanenbaum, et al., “Sistemas Operativos. Diseño e implementación”, 2da. Edición, Prentice Hall, México, 1998, ISBN: 970-17-0165-8.

• Aguas, N. (2009) Procesos y Procesadores en Sistemas Distribuidos.

Documents

Procesos y Procesadores en Sistemas Distribuidos M.C. Juan Carlos Olivares Rojas [email protected] jcolivar