40
Incomplete factorization based on a HID Hybrid Solver Parallelization HIPS: a parallel hybrid direct/iterative solver based on a Schur complement approach. Sparse days at CERFACS J. Gaidamour, P. enon LaBRI and INRIA Bordeaux - Sud-Ouest (ScAlApplix team), France ANR Project Solstice (ANR-06-CIS) June 23-24, 2008 HIPS : an hybrid direct/iterative solver 1 / 33

HIPS: a parallel hybrid direct/iterative solver based on a

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

HIPS: a parallel hybrid direct/iterative solver basedon a Schur complement approach.

Sparse days at CERFACS

J. Gaidamour, P. Henon

LaBRI and INRIA Bordeaux - Sud-Ouest (ScAlApplix team), FranceANR Project Solstice (ANR-06-CIS)

June 23-24, 2008

HIPS : an hybrid direct/iterative solver 1 / 33

Page 2: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Outlines

1 Introduction

2 Incomplete factorization based on a HID

3 Hybrid SolverExperimental results

4 ParallelizationExperimental results

5 Conclusion

HIPS : an hybrid direct/iterative solver 2 / 33

Page 3: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Outlines

1 Introduction

2 Incomplete factorization based on a HID

3 Hybrid SolverExperimental results

4 ParallelizationExperimental results

5 Conclusion

HIPS : an hybrid direct/iterative solver 3 / 33

Page 4: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Introduction

HIPS : Hierarchical Iterative Parallel Solver

Goals :

Solve A.x = b

Build algebraic preconditioners for a Krylov method : noinformation about the mathematical problem (black box).

Parallelism of domain decomposition like methods (e.g. add.Schwarz methods) is appealing but◮ convergence can decrease quickly with the number ofdomains.

Build a global Schur complement preconditioner (ILU) fromthe local domain matrices only.

HIPS : an hybrid direct/iterative solver 4 / 33

Page 5: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Introduction

We want the smallest Schurcomplement vs nb domains :

use decomposition of the adj.graph of the matrix with an overlapof one-vertex wide.

Example :

HIPS : an hybrid direct/iterative solver 5 / 33

Page 6: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Outlines

1 Introduction

2 Incomplete factorization based on a HID

3 Hybrid SolverExperimental results

4 ParallelizationExperimental results

5 Conclusion

HIPS : an hybrid direct/iterative solver 6 / 33

Page 7: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Incomplete factorization based on a HID [Henon, Saad, 06]

We want an incomplete factorization of the matrix withoutcreating edge (fill-in) outside the local domain matrices (keep theparallelism).Problem : in a domain, we need an ordering of the interfacecompatible with neighboring domains.◮ Use a hierarchical interface decomposition :

partition the interface nodes according to the domains theybelong to.

respect some properties to ensure good parallelism andnumerical behavior.

HIPS : an hybrid direct/iterative solver 7 / 33

Page 8: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Simple case : a 2D grid

In this case the HID

Domain

Edges

Points

Interior

PointCross-

Grid 8 × 8. The reordered matrix.We use the quotient graph induced by this partition to define blockincomplete factorizations

HIPS : an hybrid direct/iterative solver 8 / 33

Page 9: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Extend to irregular graphs

A HID respects two rules :

1 Connectors of a same level are notconnected

2 A connector of the level k is aseparator for at least twoconnectors of the level k − 1.

1 2 2 3

1 2 3

1 4 3 4

1 2 3 41

2

3

4

Example :

HIPS : an hybrid direct/iterative solver 9 / 33

Page 10: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Extend to irregular graphs

A HID respects two rules :

1 Connectors of a same level are notconnected

2 A connector of the level k is aseparator for at least twoconnectors of the level k − 1.

1 2 2 3

1 4 3 4

1

2

3

4

1 2 3 4

Example :

HIPS : an hybrid direct/iterative solver 9 / 33

Page 11: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Extend to irregular graphs

Unmatched elimination path are atleast of length 4.

1 2 2 3

1 4 3 4

1

2

3

4

1 2 3 4

Example :

HIPS : an hybrid direct/iterative solver 10 / 33

Page 12: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Extend to irregular graphs

A HID respects two rules :

1 Connectors of a same level are notconnected

2 A connector of the level k is aseparator for at least twoconnectors of the level k − 1.

◮ The HID heuristics (NP problems) :

minimize the number of nodes inthe higher connector levels.

minimize the number of connectorlevels.

Example :

HIPS : an hybrid direct/iterative solver 11 / 33

Page 13: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Fill-in block pattern (viewed from a local matrix)

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

����������������

����������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

��������������������

12 3

4 56

56

3625124514

2312

45

2356

2,3,5,6

1,2,4,5

2,5

2,3

1,2

2 2 2

2

2

2 2,5

2,5

2

2

2

2

2

2 2 2

2 2 1,2

2 2,3 2,5 2,5

2,521,2

2 2 2,3

2,5

2

Local blocked−matrix for subdomain 2

Empty sparse matrix in intial matrix(fill−in occurs during factorization)

Global domain partitioned into 6 subdomains

1 2 3

1

5

4 5 6

2

3

4

6

in the locally consistent strategyFill−in in these blocks is allowed

HIPS : an hybrid direct/iterative solver 12 / 33

Page 14: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Fill-in block pattern (viewed from the global matrix)

12 3

4 56

56

3625124514

2312

45

2356

LS , US : strictly consistent ruleNo fill-in is allowed outside the initial block pattern of A (keep the block diag. struct.)

HIPS : an hybrid direct/iterative solver 13 / 33

Page 15: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Fill-in block pattern (viewed from the global matrix)

12 3

4 56

56

3625124514

2312

45

2356

LS , US : locally consistent ruleFill-in is allowed in any place of the local domain matrices.

HIPS : an hybrid direct/iterative solver 14 / 33

Page 16: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Elimination order (matters in locally consistent case) :

����������������

����������������

������������

������������

������������

������������

����������������

����������������

������������

������������

������������

������������

������������

������������

������������

������������

���������

���������

���������

���������

������������

������������

���������

���������

������������

������������

���������

���������

���������

���������

���������

���������

������������

������������

����������������

����������������

����������������

����������������

������������

������������

����������������

����������������

����������������

����������������

����������������

����������������

����������������

����������������

������������

������������

������������

������������

���������

���������

������������

������������

���������

���������

������������

������������

������������

������������

������������

������������

����������������

����������������

������������

������������

������������

������������

����������������

����������������

������������

������������

������������

������������

������������

������������

������������

������������

���������

���������

���������

���������

������������

������������

���������

���������

������������

������������

���������

���������

���������

���������

���������

���������

����������������

����������������

������������

������������

������������

������������

������������

������������

���������

���������

������������

������������

���������

���������

���������

���������

���������

���������

���������

���������

������������

������������

���������

���������

����������������

����������������

������������

������������

������������

������������

������������

������������

������������

������������

����������������

����������������

����������������

����������������

���������

���������

������������

������������

����������������

����������������

������������

������������

������������

������������

������������

������������

������������

������������

���������

���������

������������

������������

������������

������������

����������������

����������������

����������������

����������������

����������������

����������������

����������������

����������������

������������

������������

������������

������������

������������

������������

���������

���������

������������

������������

���������

���������

���������

���������

���������

���������

���������

���������

������������

������������

���������

���������

����������������

����������������

������������

������������

������������

������������

������������

������������

���������

���������

������������

������������

������������

������������

���������

���������

������������

������������

������������

������������

������������

������������

������������

������������

����������������

����������������

����������������

����������������

������������

������������

����������������

����������������

������������

������������

����������������

����������������

����������������

����������������

����������������

����������������

������������

������������

���������

���������

���������

���������

������������

������������

���������

���������

���������

���������

���������

���������

���������

���������

������������

������������

������������

������������

����������������

����������������

������������

������������

����������������

����������������

������������

������������

������������

������������

������������

������������

������������

������������

���������

���������

���������

���������

���������

���������

������������

������������

������������

����������������

���������

���������

������������

������������

������������

������������

������������

������������

����������������

����������������

����������������

������������

������������

������������

���������

���������

���������

���������

���������

���������

������������

������������

������������

����������������

����������������

������������

������������

������������

���������

���������

���������

���������

���������

���������

������������

������������

������������

����������������

����������������

����������������

������������

������������

������������

������������

������������

������������

���������

���������

����������������

������������

������������

������������

���������

���������

���������

���������

���������

���������

������������

������������

������������

������������

���������

���������

���������

���������

���������

���������

������������

������������

������������

����������������

�������

�������

�������

�������

������

������

������

������

��������������

��������������

��������������

��������������

������������

������������

������������

������������

��������������

��������������

��������������

��������������

������������

������������

������������

������������

�������

�������

�������

�������

������

������

������

������

�������

�������

�������

�������

������

������

������

������

��������������

��������������

��������������

��������������

������������

������������

������������

������������

�������

�������

������

������

������

������

�������

�������

��������������

��������������

������������

������������

������������

������������

��������������

��������������

��������������

��������������

������������

������������

������������

������������

��������������

��������������

�������

�������

������

������

������

������

�������

�������

�������

�������

������

������

������

������

�������

�������

��������������

��������������

������������

������������

������������

������������

��������������

��������������

�������

�������

�������

�������

������

������

������

������

��������������

��������������

��������������

��������������

������������

������������

������������

������������

�������

�������

�������

�������

������

������

������

������

�������

�������

������

������

������

������

�������

�������

����������������

������������

������������

������������

������������

����������������

����������������

����������������

����������������

������������

������������

������������

���������

���������

������������

������������

������������

������������

������������

������������

������������

������������

���������

���������

���������

���������

���������

���������

����

��������

������

��������

����

������

����

��������

������

��������

����

����

��

�� ����

��������������

��������������

��������������

��������������

1. 2. 3.

4. 5. 6.

7. 8. 9.

The connectors are orderedlocally according to a globalordering. We use a MIS algorithmto eliminate at a time amaximum number of connectors.

HIPS : an hybrid direct/iterative solver 15 / 33

Page 17: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Block fill-in pattern in a real case (bcsstk14)

◮ the strictly pattern is really “cheaper” than the locally pattern.◮ we can use a ILUT (numerical threshold) to control the fillinside the block pattern.

Locally consistent rules Strictly consistent rules

HIPS : an hybrid direct/iterative solver 16 / 33

Page 18: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Outlines

1 Introduction

2 Incomplete factorization based on a HID

3 Hybrid SolverExperimental results

4 ParallelizationExperimental results

5 Conclusion

HIPS : an hybrid direct/iterative solver 17 / 33

Page 19: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Hybrid direct/iterative : Schur complement approach

The linear system A.x = b can be written as :

(

AB ABC

ACB AC

)

.

(

xB

xC

)

=

(

yB

yC

)

(1)

The system A.x = B can be solved in three steps :

AB .zB = yB

S .xC = yC − ACB .zB

AB .xB = yB − ABC .xC

(2)

with S = AC − ACB .A−1B .ABC = AC − ACB .U−1

B .L−1B .ABC

HIPS : an hybrid direct/iterative solver 18 / 33

Page 20: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Hybrid direct/iterative : Schur complement approach

Schur Complement utilization :

AB = LB .UB : exact factorization⇒ direct resolution of subsystems (1) and (3)Each interior of subdomains can be computedindependently

S ≈ LS .US : incomplete factorization⇒ (2) is solved by a preconditioned Krylovsubspace methodSolve the Schur complement by a preconditionedKrylov method (GMRES).

8

>

<

>

:

AB .zB = rB (1)

S .xC = rC − ACB .zB (2)

AB .xB = rB − ABC .xC (3)

Iterative resolution : Iterate on S is numerically equivalent to iterate on the

whole system A.

HIPS : an hybrid direct/iterative solver 19 / 33

Page 21: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Precondition the Schur complement

◮ Non-zero pattern of the global factors obtained on a small matrix :(Fill-in allowed only in local Schur complement)

(

LB

ACBUB−1 S

)

◮ How to avoid memory cost of ACBUB−1 and S in 3D problems

[Gaidamour, Henon, 08] :

We do not need to store S , instead of S .x we use(AC − ACB .U−1

B.L−1

B.ABC ).x

ILUT : ACBUB−1 (resp. LB

−1ABC ) is numerically sparsified along itscomputations (blockwise ILUC(t)= left looking) :

LS .US ≈ S = ˜(ACB .U−1B

). ˜(L−1B

.ABC ) ≈ S

HIPS : an hybrid direct/iterative solver 20 / 33

Page 22: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Test cases

Test cases from grid-TLSE collection(http://gridtlse.enseeiht.fr:8080/websolve/)

MHD1 :

Unsymmetric real matrix3D magneto-hydrodynamic flow problem

AUDI :

Symmetric real matrix3D structural mechanic problem

Haltere, Amande :

Symmetric complex matrix3D electromagnetism problems (Maxwell)

HIPS : an hybrid direct/iterative solver 21 / 33

Page 23: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Test cases

Fill-in and OPC are given for a direct method.

Matrix unknowns non-zeros fill-in OPCMHD1 485, 597 24, 233, 141 52.4 9.0 . 1012

AUDI 943, 695 39, 297, 771 41.2 5.4 . 1012

Haltere 1, 288, 825 10, 476, 775 38.7 7.5 . 1012

Amande 6, 994, 683 58, 477, 383 53.9 1.5 . 1013

HIPS : an hybrid direct/iterative solver 22 / 33

Page 24: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Test cases

Experimental conditions :

10 nodes of 2.6 Ghz quadri dual-core Opteron (Myrinet)

Partitionner : Scotch

||b − A.x ||/||b|| < 10−7, no restart in GMRES

Thresholds : MHD1, Audi, Amande = 0.001, Haltere = 0.01

The Amande test case does not converge with the strictlypattern and better results were obtained with using nothreshold in coupling (Ls , Lt

s are computed from the exactSchur complement).

HIPS : an hybrid direct/iterative solver 23 / 33

Page 25: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Iterations/number of domains

MHD1 (485, 597) : nb domains from 33 to 132

0

20

40

60

80

100

120

30 40 50 60 70 80 90 100 110 120 130 140

MHD1 : StrictlyMHD1 : Locally

AUDI (943, 695) : nb domains from 53 to 326

0

20

40

60

80

100

120

140

160

180

50 100 150 200 250 300 350

AUDI : StrictlyAUDI : Locally

HALTERE (1, 288, 825) : nb domains from 119 to 1894

0

5

10

15

20

25

30

35

0 200 400 600 800 1000 1200 1400 1600 1800 2000

HALTERE : StrictlyHALTERE : Locally

AMANDE (6, 994, 683) : nb domains from 801 to 3004

0

5

10

15

20

500 1000 1500 2000 2500 3000 3500

AMANDE : Locally

HIPS : an hybrid direct/iterative solver 24 / 33

Page 26: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Seq. Times (prec+solve)/number of domains

MHD1 (485, 597) : nb domains from 33 to 132

0

100

200

300

400

500

600

30 40 50 60 70 80 90 100 110 120 130 140

MHD1 : StrictlyMHD1 : Locally

AUDI (943, 695) : nb domains from 53 to 326

0

200

400

600

800

1000

1200

1400

50 100 150 200 250 300 350

AUDI : StrictlyAUDI : Locally

HALTERE (1, 288, 825) : nb domains from 119 to 1894

0

20

40

60

80

100

120

140

0 200 400 600 800 1000 1200 1400 1600 1800 2000

HALTERE : StrictlyHALTERE : Locally

AMANDE (6, 994, 683) : nb domains from 801 to 3004

0

500

1000

1500

2000

2500

3000

500 1000 1500 2000 2500 3000 3500

AMANDE : Locally

HIPS : an hybrid direct/iterative solver 25 / 33

Page 27: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Fill ratio/number of domains (Amande : Peak = +3.5)

MHD1 (485, 597) : nb domains from 33 to 132

0

2

4

6

8

10

30 40 50 60 70 80 90 100 110 120 130 140

MHD1 : StrictlyMHD1 : Locally

AUDI (943, 695) : nb domains from 53 to 326

0

1

2

3

4

5

6

7

8

9

50 100 150 200 250 300 350

AUDI : StrictlyAUDI : Locally

HALTERE (1, 288, 825) : nb domains from 119 to 1894

0

2

4

6

8

10

12

14

0 200 400 600 800 1000 1200 1400 1600 1800 2000

HALTERE : StrictlyHALTERE : Locally

AMANDE (6, 994, 683) : nb domains from 801 to 3004

0

2

4

6

8

10

12

14

16

18

500 1000 1500 2000 2500 3000 3500

AMANDE : LocallyAMANDE : Locally

HIPS : an hybrid direct/iterative solver 26 / 33

Page 28: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Outlines

1 Introduction

2 Incomplete factorization based on a HID

3 Hybrid SolverExperimental results

4 ParallelizationExperimental results

5 Conclusion

HIPS : an hybrid direct/iterative solver 27 / 33

Page 29: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Unknown elimination in parallel

We build a decomposition of the adjacency graph of the systeminto a set of small subdomains (≃ 1000 to 5000 nodes).

We can recover communications between processors by eliminationof local subdomains

HIPS : an hybrid direct/iterative solver 28 / 33

Page 30: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Workload and memory balance

◮ Subdomains distribution on the processors :

Obtained by partitioning the weighted “domain graph”(SCOTCH or Metis)

Balance of S .x computation (solving step) by using thesymbolic factorization to compute the number of NNZ of theinteriors of subdomains.

◮ Finer level of balance : election of the processor responsible forthe computation of a piece of interface (connectors).

HIPS : an hybrid direct/iterative solver 29 / 33

Page 31: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver ParallelizationResults

Parallel time (prec+solve) (logarithmic scale)

MHD1 (485, 597) : 64 domains

2

4

8

16

32

64

128

256

512

1 2 4 8 16 32 64

StrictlyIdeal strictly

LocallyIdeal locally

AUDI (943, 695) : 231 domains

4

8

16

32

64

128

256

512

1024

1 2 4 8 16 32 64

StrictlyIdeal strictly

LocallyIdeal locally

HALTERE (1, 288, 825) : 1062 domains

1

2

4

8

16

32

64

128

1 2 4 8 16 32 64

StrictlyIdeal strictly

LocallyIdeal locally

AMANDE (6, 994, 683) : 2062 domains

32

64

128

256

512

1024

2048

4096

1 2 4 8 16 32 64

LocallyIdeal

HIPS : an hybrid direct/iterative solver 30 / 33

Page 32: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Outlines

1 Introduction

2 Incomplete factorization based on a HID

3 Hybrid SolverExperimental results

4 ParallelizationExperimental results

5 Conclusion

HIPS : an hybrid direct/iterative solver 31 / 33

Page 33: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Conclusion

Conclusion :

Generic algebraic approach, tight coupling between state of the artdirect method (supernodal) and ILU(t) implementation,

Trade-off performance/memory : easy tuning (choose thresholds,domain size)

Prospects :

Provide automatically a domain size parameter (based on memory).

Partitioning is an open question...numerical weight, connectivity

Coarse grid based on the HID (for elliptic problems)

HIPS : an hybrid direct/iterative solver 32 / 33

Page 34: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Download HIPS

http://hips.gforge.inria.fr

Features : symmetric, unsymmetric (Cholesky/LU,ICC(t)/ILU(t)), real or complex systems.

Method : Hybrid, multistage ICC(t), ILU(t).

Compatible with the graph partitioners SCOTCH and METIS.

Cecill-C license (LGPL-like licence)

HIPS : an hybrid direct/iterative solver 33 / 33

Page 35: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Construction of the domain partition

The domain partition is constructed from the reordering based onNested-Dissection like algorithms (eg : METIS, SCOTCH)

C

C

C

CC

73

4

1

26C

C5

C

C

CCC

C

C

7

6 3

5 4 2 1

D D D D D DDD8 5 4 3 2 17 6

⇒ Minimize overlap between subdomains, quality of the interface

HIPS : an hybrid direct/iterative solver 33 / 33

Page 36: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Construction of the domain partition

We choose a level of the elimination tree of direct method :

Subtrees rooted in this level are the interior of subdomains

The upper part of the elimination tree corresponds to theinterfaces

Possibility to choose the ratio of direct/iterative according to theproblem difficulty or the accuracy needed.

HIPS : an hybrid direct/iterative solver 33 / 33

Page 37: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Test case : Haltere (sequential study)

◮ Convergence/time for several parameters with two differentdomain size parameters :

Domain size set to 1000(1021 domains) :

1e-12

1e-10

1e-08

1e-06

1e-04

0.01

50 100 150 200 250 300

Rel

ativ

e re

sidu

al n

orm

Time (sec.)

Strictly consistent, t = 0.01 Strictly consistent, t = 0.001Locally consistent, t = 0.01 Locally consistent, t = 0.001

Domain size set to 10000(119 domains) :

1e-12

1e-10

1e-08

1e-06

1e-04

0.01

50 100 150 200 250 300

Rel

ativ

e re

sidu

al n

orm

Time (sec.)

Strictly consistent, t = 0.01 Strictly consistent, t = 0.001Locally consistent, t = 0.01 Locally consistent, t = 0.001

(preconditioning time = curve offset)

HIPS : an hybrid direct/iterative solver 33 / 33

Page 38: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Test case : Haltere (parallel study)

◮ HIPS : ILUT (τ = 0.01, 10−7)

1021 domains of ≃ 1481 nodes

fill ratio in precond : 5.70 (peak)

dim(S) = 14.26% of dim(A)

Strictly consistent :21 iterationsfill ratio in solve : 5.52

# proc Precond. Solve Total(sec.) (sec.) (sec.)

1 45.09 36.74 81.842 24.48 20.76 45.244 12.08 15.65 27.748 6.15 8.71 14.8616 3.06 3.31 6.3732 1.58 1.92 3.5064 0.89 1.07 1.96

Locally consistent :13 iterationsfill ratio in solve : 5.69

# proc Precond. Solve Total(sec.) (sec.) (sec.)

1 54.55 24.90 79.452 29.17 13.50 42.684 14.28 8.69 22.968 7.31 5.19 12.5016 3.82 2.76 6.5832 1.97 1.31 3.2964 1.89 0.86 2.75

HIPS : an hybrid direct/iterative solver 33 / 33

Page 39: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Test case : Amande

Tab.: Direct factorization using MUMPS

A

Haltere : A

# proc Facto. Solve Total nnzmax

(sec.) (sec.) (sec.) ×106

16 29 0.44 29.44 52.832 16 0.26 16.26 22.6

A

Amande : A

# proc Facto. Solve Total nnzmax

16 512 4.5 516.5 407.732 299 2.4 301.4 179.5

HIPS : an hybrid direct/iterative solver 33 / 33

Page 40: HIPS: a parallel hybrid direct/iterative solver based on a

Incomplete factorization based on a HID Hybrid Solver Parallelization

Test case : Amande

◮ HIPS : ILUT (locally consistent, τ = 0.001, 10−7)Time decomposition for one iteration of GMRES :

# proc Total Triangular S.x Other1 Iter. (sec.) Solve (sec.) (sec.) (sec.)

2 11.29 3.94 6.91 0.4464 0.58 0.19 0.31 0.08

HIPS : an hybrid direct/iterative solver 33 / 33