N ěkteré výsledky a problémy moderního superpočítačového výzkumu

Preview:

DESCRIPTION

N ěkteré výsledky a problémy moderního superpočítačového výzkumu. Zdeněk DOSTÁL , David Horák, Oldřich Vlach, Vít Vondrák, Dan Stefanica, Michael Lesoinne, Charbel Farhat, … Department of Applied Math., FEI–VŠB Technical University Ostrava Baruch College, City University of New York - PowerPoint PPT Presentation

Citation preview

Některé výsledky a problémy moderního superpočítačového výzkumu

Zdeněk DOSTÁL, David Horák, Oldřich Vlach, Vít Vondrák, Dan Stefanica, Michael Lesoinne,

Charbel Farhat, … 

Department of Applied Math., FEI–VŠB Technical University OstravaBaruch College, City University of New York

University of Colorado in BoulderStanford University

 ŠKOMAM 2005

http://www.am.vsb.cz

Obsah

1. Paralelní algoritmy pro rovnice

2. Metody rozložení oblasti pro rovnice

3. Příklady

4. FETI metody pro variační nerovnice

5. Příklady

Numerická škálovatelnost

Výpočetní složitostVýpočetní složitost

CC11 nn opera operacící k

- - Přímé metodyPřímé metody (skyline, frontal, sparse, …) (skyline, frontal, sparse, …)

k > 2> 2- optim- optimáállníní itera iteračníční method methodyy

k ~ 1~ 1

NumericNumerická škálovatelnost, která je nezbytnáká škálovatelnost, která je nezbytnápropro paralelparalelníní škálovatelnostškálovatelnost

Škálovatelné (optimální) algoritmy

cena počet neznámých

Paralelní škálovatelnost:

Numerická škálovatelnost:

čas 1/počet procesorů

H. A. Schwarz (1869)

Logo ddm.org

Rozložení oblasti s překrytím

2

2

1 1 1 2 2 2

1 1 2 2

1 2 1 2

v v v

| 0 | 0 | 0

v

u f u f u f

u u u

u u

1

1

Schwarzův algoritmus(H. A. Schwarz, 1869)

2

2

12

1

1

1 12

2

2

21

FETI metody pro pružnost

f

f

h

2

u f

f

FETI (C. Farhat, F.-X. Roux, J. Mandel 90’s)

h2

H

4

1

2

3

H

FETI-DP (C. Farhat, M. Lesoinne, P. Le Tallec, D. Rixen, J. Mandel, ….]

h

1

43

2

Corners

Reminders H

Pružnost - příklad

Deformace difrakční mřížkyDeformace difrakční mřížky – – one-levelone-level FETI FETI -- -- iPSC-860iPSC-860

Neq Np = Ns Niter Ttotal

17,055 16 31 31.51 s.

120,987 128 32 39.35 s.

Skořepina - příklad

Vyztužené křídlo -- Two-Level FETI -- IBM SP2

NdofNdof NpNp NiterNiter CPUCPU

486,660486,660 3535 5656 198198 secs. secs.

873,320873,320 7070 5454 205205 secs. secs.

140140 5151 98 secs.98 secs.

1,946,6401,946,640 140140 5757 239239 secs. secs.

CPU výsledky na ASCI RED (2)

46,87546,875

159,375159,375

316,875316,875

699,375699,375

1,216,8751,216,875

1,936,8751,936,875

2,881,8752,881,875

4,096,8754,096,875

5,626,8755,626,875

88

2828

6464

124124

216216

344344

512512

728728

1,0001,000

14 (27)14 (27)

18 (30)18 (30)

18 (31)18 (31)

18 (31)18 (31)

19 (31)19 (31)

19 (31)19 (31)

19 (32)19 (32)

19 (33)19 (33)

19 (34)19 (34)

0.001 sec0.001 sec

0.007 sec0.007 sec

0.018 sec0.018 sec

0.038 sec0.038 sec

0.073 sec0.073 sec

0.131 sec0.131 sec

0.203 sec0.203 sec

0.298 sec0.298 sec

0.414 sec0.414 sec

209 (140) sec209 (140) sec

214 (142) sec214 (142) sec

215 (143) sec215 (143) sec

216 (143) sec216 (143) sec

216 (144) sec216 (144) sec

217 (144) sec217 (144) sec

218 (146) sec218 (146) sec

218 (147) sec218 (147) sec

222 (151) sec222 (151) sec

BP2: Dirichlet (Lumped)BP2: Dirichlet (Lumped)

Velikost úlohyVelikost úlohy NN s s = N = N p p NN itr itr Factor Factor CelkemCelkem CPU CPU

e e = 10 = 10 -6-6

SCALABILITY RESULTS ON ASCI-RED

Solver: FETI-Dirichlet -- Supercomputer: ASCI Red OptionS

peed

-up

Number of processors

FETI--BP1

FETI+Salinas--BP1

FETI+Salinas--BP2

FETI--BP2

Contact problem of elasticity

h

2

u

cf

FETI domain decomposition

h2

H

4

1

2

3

H

E

I

FETI-DP domain decomposition

h

1

43

2

Corners

Reminders H

I

Solution and numerical scalability of FETI for n ranging from 50 to 2 130 048 (C/PETSc)

H 1/2 1/4 1/8

H/h=8 648/87 2592/447 10365/1983

20 23 27

H/h=32 8712/327 34848/1695 139392/7551

33 30 37

H/h=128 133128/1287 532512/6687 2130048/29823

59 36 47

Numerical scalability

1/ 256, 1/ 4,

primal dimension 135 200, dual dimension 3359

2 outer iterations, 33 cg iterations

h H

Bobcat Sn6710 Lomond

Kompozit s vloženými inkluzemi

Tvarová optimalizace

Závěr

1. Pořád se dá něco vymýšlet

2. Paralelní počítače vedou k novému pohledu na výpočetní metody

3. Dnes se řeší úlohy, o kterých se před 10ti lety nikomu ani nezdálo

4. To vše se dělá i na VŠB-TU!!!

Recommended