19
10. Februar 2012 Axel Hübl E-Mail: [email protected] Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) Linux Cluster in Theorie und Praxis MD Simulation

MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Embed Size (px)

Citation preview

Page 1: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

10. Februar 2012

Axel Hübl

E-Mail: [email protected]

Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH)

Linux Cluster in Theorie und Praxis

MD Simulation

Page 2: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 2 / 19Axel Hübl

0 Gliederung

1 Modell

2 Implementierung

3 Benchmarks

4 Anwendung: Kollision zweier Sternhaufen

Page 3: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 3 / 19Axel Hübl

1 Modell

Simulation kurzreichweitiger Kräfte

Wechselwirkungen mit Cut-Off z.B. Gravitationskraft

F ~ x -2

(Ann.: N Teilchen gleicher Massen)

Page 4: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 4 / 19Axel Hübl

1 Modell

Simulation kurzreichweitiger Kräfte

Zellbasierte räumliche Aufteilung

Page 5: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 5 / 19Axel Hübl

1 Modell

Simulation kurzreichweitiger Kräfte

Zellbasierte räumliche Aufteilung

Page 6: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 6 / 19Axel Hübl

1 Modell

Simulation kurzreichweitiger Kräfte

Zellbasierte räumliche Aufteilung

Page 7: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 7 / 19Axel Hübl

1 Modell

Simulation kurzreichweitiger Kräfte

Zellbasierte räumliche Aufteilung

Page 8: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 8 / 19Axel Hübl

2 Implementierung

Parallelisiert mit MPI

1D Domain Decomposition

Page 9: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 9 / 19Axel Hübl

2 Implementierung

Parallelisiert mit MPI

1D Domain Decomposition

Page 10: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 10 / 19Axel Hübl

2 Implementierung

Parallelisiert mit MPI

1D Domain Decomposition

Page 11: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 11 / 19Axel Hübl

2 Implementierung

Parallelisiert mit MPI

1D Domain Decomposition

Page 12: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 12 / 19Axel Hübl

2 Implementierung

Parallelisiert mit MPI

Gebiete in einer lokalen Domain (je Rank)

Page 13: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 13 / 19Axel Hübl

3 Benchmarks

LCTP Cluster:

4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4)

L1: 24 KiB, L2: 512 KiB

2 GiB RAM / Node

HZDR: Hypnos

4 Nodes mit je 2 AMD Dual-Core Opteron 2,6 GHz

L1: 64 KiB, L2: 512 KiB, L3: 6 MiB

16 GiB RAM / Node

Strong- & Weak-Scaling

Domaininformationen siehe Appendix

Page 14: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 14 / 19Axel Hübl

3 Benchmarks

Strong-Scaling Größen: s. Appendix

Page 15: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 15 / 19Axel Hübl

3 Benchmarks

Weak-Scaling Größen: s. Appendix

Page 16: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 16 / 19Axel Hübl

4 Kollision von zwei Sternhaufen

Simulation: Video

1 Million Zeitschritte, repräsentieren 12,7 Millionen Jahre

Simulationszeit ca. 15min mit Phenom II X4(3,6 GHz; L1: 64 KiB, L2: 512 KiB, L3: 6 MiB; 8GiB RAM)

ca. 1000 Teilchen, zufällig verteilt nach Dichtefunktion

Angelehnt an Sternhaufen Hyaden (Stier),ca. 15 LJ Durchmesser und je 350 Sterne

Page 17: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 17 / 19Axel Hübl

A Appendix

Konfigurationen Benchmarks

Strong Scaling Zotac

384x384 globale Zellen

30 Timesteps, 10 Partikel / Zelle

ICC 12.1 mit -O2, OpenMPI 1.4.4, Ethernet

Strong Scaling Hypnos

5760x192 globale Zellen

200 Timesteps, 10 Partikel / Zelle

ICC 12.0 mit -O2, OpenMPI 1.4.4, IB

Page 18: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 18 / 19Axel Hübl

A Appendix

Konfigurationen Benchmarks

Weak Scaling Zotac

384x96 lokale Zellen

30 Timesteps, 10 Partikel / Zelle

ICC 12.1 mit -O2, OpenMPI 1.4.4, Ethernet

Weak Scaling Hypnos

5760x96 lokale Zellen

200 Timesteps, 10 Partikel / Zelle

ICC 12.0 mit -O2, OpenMPI 1.4.4, IB

Page 19: MD Simulation Axel Hübl -  · Axel Hübl Folie 13 / 19 3 Benchmarks LCTP Cluster: 4 Nodes mit Atom 330 CPUs 1,6 GHz (Core/HT 2/4) L1: 24 KiB, L2: 512 KiB 2 GiB RAM / Node HZDR: Hypnos

Folie 19 / 19Axel Hübl

B Referenzen

Rapaport. The Art of Molecular Dynamics Simulation

Cambridge University Press, 2. Auflage, 2004

Perryman. The Hyades: distance, structure, dynamics,

and age

Astronomy & Astrophysics 331: 81–120, 1998

MPI Forum. MPI: A Message-Passing Interface Standard

University of Tennessee, Version 2.2, 2009