Grundlagen der Algorithmen und Datenstrukturen Kapitel 3.1-3.2 Prof. Dr. Christian Scheideler TexPoint fonts used in EMF. Read the TexPoint manual before

Grundlagen der Algorithmen und Datenstrukturen

Kapitel 3.1-3.2

Prof. Dr. Christian Scheideler

Was passiert mit den Studienbeiträgen?

www.in.tum.de/studium/studienbeitraege.html

Ihr könnt aktiv bei der Verwendung der Studienbeiträge mitgestalten.Möglichkeiten sich aktiv einzubringen sind beispielsweise dieEinreichung von Vorschlägen für Maßnahmen (siehe Website), oderdas Engagement in der Fachschaft, welche Eure Interessen vertritt.Eure Mithilfe ist gefragt!

Für weitere Fragen, Anregungen oder Kritik wendet Euch bitte anJochen Reich (Qualitätsmanagement Fakultät für Informatik), HerrnProf. Dr. Matthes (Studiendekan) oder Eure Fachschaft.

Grundlegende Laufzeitanalyse

Eingabe(z.B. unsortierte Liste)

Algorithmus(z.B. Bubblesort)

Ausgabe(z.B. sortierte Liste)

Eingabe(z.B. Such-Operationen)

Datenstrukturoperationen(z.B. Move-to-Front)

Ausgabe(z.B. Such-Liste)

Kapitel 3

Kapitel 3

Thema: Repräsentation von Sequenzen als Felder und verkettete Listen

• Was ist eine Sequenz?• 3.1-3.2: Repräsentation als Feld und

amortisierte Analyse• 3.3: Repräsentation als verkettete Liste• 3.4: Stapel (Stacks) und Schlangen

(Queues)

SequenzenSequenz:

s = <e0,…,en-1>

Arten, auf Element zuzugreifen:• Feldrepräsentation: absoluter Zugriff über s[i]

• Listenrepräsentation: relativer Zugriff über Nachfolger und/oder Vorgänger

s[0]: e0 s[1] s[2] s[3] s[4] s[5] ….

e0 e1

Nachf.

Vorg.e2

Nachf.

Vorg.e3

Nachf.

Vorg.

Nachf.

Vorg.

….s

Sequenz als Feld

Operationen:• s[¢]: Index-Operation• <e0,…,en>.pushBack(e) = <e0,…,en,e>

• <e0,…,en>.popBack = <e0,…,en-1>

• Size(<e0,…,en-1>) = n

e0 e1 e2 … en e ….

e0 e1 e2 … en-1 ….

Sequenz als Feld

Problem: • Im vornherein nicht bekannt, wieviele

Elemente das Feld enthalten wird• Nur Primitiv für Allokation von statischen

Feldern gegeben(s := allocate Array[0..w] of Element)

Lösung: Datenstruktur für dynamisches Feld

3.1 Dynamisches Feld

Erste Idee:• Jedesmal, wenn Feld s nicht mehr

ausreicht (n>w+1), generiere neues Feld der Größe w+1+c für ein festes c.

s[0] s[1] s[2] s[3] s[w]….

s[0] s[1] s[2] s[3] s[w]…. s[w+1] s[w+c]….

Neues allocate und Umkopieren

Dynamisches FeldZeitaufwand für Erweiterung ist O(w+c):

Zeitaufwand für n pushBack Operationen:• Aufwand von O(w+c) je c Operationen• Gesamtaufwand: O(i=1

n/c c¢ i) = O(n2)

s[0] s[1] s[2] s[3] s[w]….

s[0] s[1] s[2] s[3] s[w]…. s[w+1] s[w+c]….

Neues allocate und Umkopieren

Dynamisches FeldBessere Idee:• Jedesmal, wenn Feld s nicht mehr ausreicht

(n>w), generiere neues Feld der doppelten Größe 2w.

• Jedesmal, wenn Feld s zu groß ist (n<w/4), generiere neues Feld der halben Größe w/2.

s[0] s[1] s[2] s[3] s[w-1]….

s[0] s[1] s[2] s[3] s[w]…. s[w-1] s[2w-1]….

Dynamisches Feld

Implementierung als Klasse UArray mit• Operator[i: IN]: Element• Function size(): IN• Procedure pushBack(e: Element)• Procedure popBack()• Procedure reallocate(w´: IN)

Dynamisches Feld

Variablen in Klasse UArray:• = 2: IR+ Wachstumsfaktor

• = 4: IR+ max. Speicheroverhead• w=1: IN momentane Feldgröße• n=0: IN momentane # Elemente• b: Array[0..w-1] of Element

b[0] b[1] b[2] b[3] b[w-1]….

Dynamisches Feld

Operator [i:IN]: Element assert 0<=i<n return b[i]

Function size(): IN return n

Dynamisches Feld

Procedure pushBack(e: Element) if n=w then reallocate(n) b[n]:=e n:=n+1

0 1 2 3b

0 1 2 3b

0 1 2 eb 3

n=w=4:

Dynamisches Feld

Procedure popBack() assert n>0 n:=n-1 if n<=w and n>0 then reallocate(n)

0 1 2 4b

0 1 2b 3

3

n=5, w=16:

Dynamisches Feld

Procedure reallocate(w´: IN) w:=w´ b´:=allocate Array[0..w-1] of Element for i:=0 to n-1 do b´[i]:=b[i] dispose b b:=b´

Umkopieren}

Dynamisches Feld

Lemma 3.1: Betrachte ein anfangs leeres dynamisches Feld s. Jede Folge =<1,…,n> von pushBack und popBack Operationen kann auf s in Zeit O(n) bearbeitet werden.

• Erste Idee: Laufzeit O(n2)• Nur durchschnittlich konstante Laufzeit pro

Operation(Fachbegriff für „durchschnittlich“: amortisiert)

Dynamisches Feld - Analyse

• Feldverdopplung:

• Feldhalbierung:

• Von – Nächste Verdopplung: >= n pushBack Ops– Nächste Halbierung: >= n/2 popBack Ops

0 1 2 3b 0 1 2 3b

0 1 2 4b 3

0 1 2 3b


• Von – Nächste Verdopplung: >= n pushBack Ops– Nächste Halbierung: >= n/2 popBack Ops

• Idee: verrechne reallocate-Kosten mit pushBack/popBack Kosten (ohne realloc)– Kosten für pushBack/popBack: O(1)– Kosten für reallocate(n): O(n)

0 1 2 3b


• Idee: verrechne reallocate-Kosten mit pushBack/popBack Kosten– Kosten für pushBack/popBack: O(1)– Kosten für reallocate(n): O(n)

• Formale Verrechnung: Zeugenzuordnung

pushB pushB pushB pushB pushB + realloc

Reallokation bei n Elementen: bezeugt durch letzte n/2 pushBack Operationen


• Formale Verrechnung: Zeugenzuordnung

• Dann jede push/popBack Op nur 1x Zeuge

pushB pushB pushB pushB pushB + realloc

popB popB popB popB popB + realloc

Reallokation bei n Elementen: bezeugt durch letzte n/2 pushBack Operationen

Reallokation bei n Elementen: bezeugt durch letzte n popBack Operationen


• Idee: verrechne reallocate-Kosten mit pushBack/popBack Kosten– Kosten für pushBack/popBack: O(1)– Kosten für reallocate(n): O(n)

• Konkret: – (n) Zeugen pro reallocate(n)– verteile O(n) Aufwand gleichmäßig auf

Zeugen• Gesamtaufwand: O(m) bei m Operationen


Alternative zur Zeugenmethode:Kontenmethode

Kontenmethode: Spiel mit Zeittokens• Günstige Operationen zahlen Tokens ein• Teure Operationen entnehmen Tokens• Tokenkonto darf nie negativ werden!


Kontenmethode: Spiel mit Zeittokens• Günstige Operationen zahlen Tokens ein! pro pushBack 2 Tokens! pro popBack 1 Token

• Teure Operationen entnehmen Tokens! pro reallocate(n) –n Tokens

• Tokenkonto darf nie negativ werden!! erfüllt über Zeugenargument


Tokenlaufzeit:• Ausführung von push/popBack kostet 1 Token! Tokenkosten für pushBack: 1+2 = 3! Tokenkosten für popBack: 1+1 = 2

• Ausführung von reallocate(n) kostet n Tokens! Tokenkosten für reallocate(n): n-n=0

Gesamtlaufzeit = O(Summe der Tokenlaufzeiten)

pushB pushB pushB pushB reallocate

3.2 Amortisierte Analyse

• S: Zustandsraum einer Datenstruktur• F: beliebige Folge von Operationen Op1,

Op2, Op3,…,Opn

• s0: Anfangszustand der Datenstruktur

• Zeitaufwand T(F) = i=1n TOpi

(si-1)

s0Op1 s1

Op2 s2Op3 sn

Opn….

Amortisierte Analyse

• Zeitaufwand T(F) = i=1n TOpi

(si-1)

• Eine Familie von Funktionen AX(s), eine pro Operation X, heißt Familie amortisier-ter Zeitschranken falls für jede Sequenz F von Operationen gilt

T(F) <= A(F) := c + i=1n AOpi

(si-1)

für eine Konstante c unabhängig von F


• Triviale Wahl von AX(s):AX(s) := TX(s)

• Dynamisches Feld (Zeittoken gen. groß):ApushBack(s):=3, ApopBack(s):=2, Arellocate(s):=0

• alternative Wahl von AX(s):über Potential S! IR>=0

! vereinfacht Beweisführung

Beispiel: Dynamisches Feld

0 1 2 3b

0 1 2 3b

0 1 2 3b

4

4 5

0 1 2 3b 4 5 6

0 1 2 3b 4 5 6 7

0 1 2 4b 3 5 6 7

s)=0

s)=2

s)=4

s)=6

s)=8

s)=0

reallocate+

pushBack

0 1 2 4b 3 5 6 7 8 s)=2

reallocate+

pushBack


0 1 2 3b s)=0

0 1 2b s)=2

0 1b s)=4

0 1b

popBack+

reallocate s)=0

Generelle Formel für (s): (ws: Feldgröße von s, ns: Anzahl Einträge)

s) = 2|ws/2 – ns|

Potential ist nicht gleich Konto!

0 1 2 3b s)=0

0 1 2b s)=2

0 1 2 3b s)=0pushBack

popBack

0 1 2 3b Konto(s)=0

0 1 2b

0 1 2 3bpushBack

popBackKonto(s)=1

Konto(s)=3

Warum Potential?

Theorem 3.3: Sei S der Zustandsraum einer Datenstruktur, sei s0 der Anfangszustand und sei :S ! IR>=0 eine nichtnegative Funktion. Für eine Operation X und einen Zustand s mit s ! s´ definiere

AX(s´) := (s´) - (s) + TX(s).

Dann sind die Funktionen AX(s) eine Familie amortisierter Zeitschranken.

X


Generelle Formel für (s): (ws: Feldgröße von s, ns: Anzahl Einträge)

s) = 2|ws/2 – ns|

Theorem 3.3:• nicht negativ, (s0)=1• ApushB(s) = + TpushB(s) <= 2+1 = 3• ApopB(s) = + TpopB(s) <= 2+1 = 3 • Arealloc(s) = + Trealloc(s) <= (0-ns)+ns = 0wobei = (s´)-(s) für s ! s´


Beweis für Arealloc(s) <= 0:• Fall 1:

• Fall 2:

0 1b 0 1 2 3b2 3

s)=ns s´)=0

0 1b 0 1b

s)=2ns s´)=0


Die Potentialmethode universal!

Theorem 3.4: Sei BX(s) eine Familie amortisierte Zeitschranken. Dann gibt es eine Potentialfunktion , so dass AX(s) <= BX(s) für alle Zustände s und alle Operationen X gilt, wobei AX(s) definiert ist wie in Theorem 3.3.

Problem: finde geeignetes Potential!Wenn erstmal gefunden, dann Rest einfach.

Nächste Woche

• Weiter mit Kapitel 3.3: Verkettete Listen

Documents

Grundlagen der Algorithmen und Datenstrukturen Kapitel 3.1-3.2 Prof. Dr. Christian Scheideler TexPoint fonts used in EMF. Read the TexPoint manual before