32
Kapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsøger at karakterisere et sandsynlighedsmål ν R ved hjælp af dets mo- menter, fortæller man essentielt hvordan man skal integrere polynomier med hensyn til ν. Når man forsøger at karakterisere sandsynlighedsmålet ved hjælp af dets for- delingsfunktion, fortæller man essentielt hvordan man skal integrere indikatorfunk- tioner for standardintervaller. Ordet karakteristisk funktion er af historiske grunde knyttet til en tilsvarende konstruktion, hvor man forsøger at karakterisere ν ved at for- tælle hvordan sandsynlighedsmålet integrerer de elementære trigonometriske funk- tioner x 7cos θ x og x 7sin θ x , for alle mulige værdier af θ R. Umiddelbart lyder det måske som en besynderlig ide at integrere trigonometriske funktioner - hvis man har lyst, skal man selvfølge- lig have lov til at integrere sinus’er og cosinus’er, men der er så meget andet man kunne kaste sig over. . . Men vi skal se at trigonometriske polynomier (linearkom- binationer af de elementære trigonometriske funktioner) udgør et meget fleksibelt system af funktioner på den reelle akse, et system, der er langt bedre egnet til brug i sandsynlighedsregning end de sædvanlige polynomier, der jo har det problem at de nødvendigvis går mod ±∞ i halerne. Og derfor karakteriserer den karakteristiske funktion vitterligt sandsynlighedsmålet på en forbavsende brugbar måde. I dette kapitel vil vi forsøge at indkredse hvad den karakteristiske funktion for et sandsynlighedsmål ν egentlig siger om målet. Hvilke egenskaber ved ν kan man af- 292

Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

Kapitel 15

Deskriptiv teori: denkarakteristiske funktion

Når man forsøger at karakterisere et sandsynlighedsmål ν på R ved hjælp af dets mo-menter, fortæller man essentielt hvordan man skal integrere polynomier med hensyntil ν. Når man forsøger at karakterisere sandsynlighedsmålet ved hjælp af dets for-delingsfunktion, fortæller man essentielt hvordan man skal integrere indikatorfunk-tioner for standardintervaller. Ordet karakteristisk funktion er af historiske grundeknyttet til en tilsvarende konstruktion, hvor man forsøger at karakterisere ν ved at for-tælle hvordan sandsynlighedsmålet integrerer de elementære trigonometriske funk-tioner

x 7→ cos θx og x 7→ sin θx ,

for alle mulige værdier af θ ∈ R. Umiddelbart lyder det måske som en besynderligide at integrere trigonometriske funktioner - hvis man har lyst, skal man selvfølge-lig have lov til at integrere sinus’er og cosinus’er, men der er så meget andet mankunne kaste sig over. . . Men vi skal se at trigonometriske polynomier (linearkom-binationer af de elementære trigonometriske funktioner) udgør et meget fleksibeltsystem af funktioner på den reelle akse, et system, der er langt bedre egnet til brugi sandsynlighedsregning end de sædvanlige polynomier, der jo har det problem atde nødvendigvis går mod ±∞ i halerne. Og derfor karakteriserer den karakteristiskefunktion vitterligt sandsynlighedsmålet på en forbavsende brugbar måde.

I dette kapitel vil vi forsøge at indkredse hvad den karakteristiske funktion for etsandsynlighedsmål ν egentlig siger om målet. Hvilke egenskaber ved ν kan man af-

292

Page 2: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.1. Komplekse integraler 293

læse, og hvordan gør man det i praksis? Men den virkelige motivation bag begrebetbliver udsat til afsnit 18.5, hvor vi viser at foldning af sandsynlighedsmål lader sigudtrykke meget effektivt i termer af karakteristiske funktioner. Foldning af sandsyn-lighedsmål er et centralt tema i sandsynlighedsregning, og beregningsmæssigt er detikke spor trivielt at håndtere. Essentielt er den karakteristiske funktion et trick, dergør det muligt at få regnemæssigt styr på foldninger i en forbløffende bred vifte afeksempler.

Det viser sig at de smidigste formuleringer af dette trick involverer komplekse tal -foldningsformlen udtrykkes simpelthen ved kompleks multiplikation. Og derfor star-ter vi med en diskussion af komplekse integraler. Denne diskussion munder dog ikkeud i overraskende konklusioner - alt er som man ville forvente det. Det er nok megetnyttigt at være klar over at de komplekse tal i denne sammenhæng mest er til pynt -teorien er ikke på de indre linier kompleks, sådan som f.eks. teorien for polynomi-umsrødder eller teorien for egenværdier for matricer. Vi får igen og igen brug for detrigonometriske additionsformler,

cos(u + v) = cos u cos v − sin u sin v , sin(u + v) = cos u sin v + sin u cos v ,

for alle u, v ∈ R. Og den fikse måde at formulere additionsformlerne på, er at inddrageden komplekse eksponentialfunktion med rent imaginære argumenter,

ei θ = cos θ + i sin θ for θ ∈ R . (15.1)

For så kan de to additionsformler samles i én formel, der kan ses som et specialtil-fælde af den komplekse eksponentialfunktions funktionalligning,

ei (u+v) = ei u ei v for u, v ∈ R .

Denne formel repræsenterer stort set al den ’komplekse analyse’ der kommer på ba-nen i det følgende.

15.1 Komplekse integraler

Lad (X,E, µ) være et målrum. Vi vil i dette afsnit interessere os for afbildningerf : X → C. Disse afbildninger skrives naturligt på formen

f = f1 + i f2

Page 3: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

294 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

hvor f1 og f2 er reelle funktioner - vi taler om f ’s real- og imaginærdel. Hvis viidentificerer Cmed R2, så har C naturligt en Borelalgebra, som vi med et vist misbrugaf notation kan kalde B2. Og vi ser at f er E − B2-målelig hvis og kun hvis real- ogimaginærdele begge er målelige reelle funktioner.

Definition 15.1 Lad (X,E, µ) være et målrum. En målelig funktion f : X → C,skrevet på formen f = f1 + i f2, er integrabel hvis

| f1| dµ < ∞ ,

| f2| dµ < ∞ .

I bekræftende fald definerer vi integralet af f som∫

f dµ :=∫

f1 dµ + i∫

f2 dµ .

De integrable komplekse funktioner kaldes ofte LC(X,E, µ) eller blot LC. Bemærkde trivielle uligheder

| f1| ≤ | f | , | f2| ≤ | f | , | f | ≤ | f1| + | f2| .

Det følger heraf at f er integrabel hvis og kun hvis∫

| f | dµ < ∞ .

Eksempel 15.2 Lad γ , 0 være et reelt tal. Idet |ei γt | = 1 for alle t ∈ R, ser viat t 7→ ei γt er integrabel med hensyn til Lebesguemålet hen over ethvert kompaktinterval [a, b]. Vi kan oven i købet regne integralet ud:

∫ b

aeiγtdt =

∫ b

acos γt dt + i

∫ b

asin γt dt

=sin γb − sin γa

γ+ i− cos γb + cos γa

γ

=−iγ

(cos γb + i sin γb − cos γa − i sin γa)

=eiγb − eiγa

iγ.

Page 4: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.1. Komplekse integraler 295

Bemærk hvor nydeligt denne formel passer ind i mønsteret for integration af den re-elle eksponentialfunktion, skønt den jo dybest set handler om trigonometriske funk-tioner.

Sætning 15.3 Lad (X,E, µ) være et målrum.

Hvis f ∈ LC og c ∈ C, så er c f ∈ LC og der gælder at∫

c f dµ = c∫

f dµ. (15.2)

Hvis f , g ∈ LC, så er f + g ∈ LC og der gælder at∫

f + g dµ =∫

f dµ +∫

g dµ. (15.3)

B: Påstandende om additionsegenskaberne er banale konsekvenser af de tilsva-rende egenskaber for reelle integraler, brugt på real- og imaginærdel for sig, så demvil vi ikke gøre noget ud af.

Der er lidt mere kød på den skalare multiplikation. Hvis f ∈ LC og c ∈ C så er∫

|c f | dµ =∫

|c| | f | dµ = |c|∫

| f | dµ < ∞ ,

ifølge de reelle regneregler, så integrabiliteten af c f er klar nok. Og (15.2) følger:hvis f = f1 + i f2 og c = c1 + ic2, så er

c f dµ =∫

(c1 f1 − c2 f2) + i(c1 f2 + c2 f1) dµ

=

c1 f1 − c2 f2 dµ + i∫

c1 f2 + c2 f1 dµ

= c1

f1 dµ − c2

f2 dµ + i(

c1

f2 dµ + c2

f1 dµ)

= (c1 + ic2)(∫

f1 dµ + i∫

f2 dµ)

= c∫

f dµ .

Page 5: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

296 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

Sætning 15.4 Lad (X,E, µ) være et målrum. Hvis f ∈ LC så gælder der at∣∣∣∣∣

f dµ∣∣∣∣∣≤

| f | dµ. (15.4)

B: Formel (15.4) går ligesom i det reelle tilfælde under navnet trekantsulig-heden.

B: Ethvert komplekst tal z kan opskrives på modulus/argument-formen

z = |z| ei θ

for et passende θ ∈ R. Bruges denne opskrivning på∫

f dµ, ser vi at for et passendeθ er ∣

∣∣∣∣

f dµ∣∣∣∣∣= e−i θ

f dµ =∫

e−i θ f dµ .

Venstre side i denne formel er rent reel, og derfor må højre side også være rent reel- integralet af e−i θ f har imaginærdel nul. Bruger vi symbolet Re(z) til at betegnerealdelen af z har vi derfor at

∣∣∣∣∣

f dµ∣∣∣∣∣=

Re(

e−i θ f)

dµ ≤∫

|Re(

e−i θ f)

| dµ ≤∫

|e−i θ f | dµ =∫

| f | dµ ,

hvor vi undervejs har benyttet at |Re(z)| ≤ |z|.�

Det er vigtigt at bemærke at majorantsætningen gælder uindskrænket. Antag atf1, f2, . . . er en følge af målelige funktioner X → C, der konvergerer punktvist moden grænsefunktion f . Hvis | fn(x)| ≤ g(x) for enM+-funktion g med endeligt integral,så er såvel f som alle fn-funktionerne integrable, og

fn dµ→∫

f dµ for n→ ∞ .

Det følger ved at bruge den sædvanlige reelle majorantsætning på følgerne af real-og imaginærdel hver for sig.

Eksempel 15.5 En funktion f : R→ C er konjugeret symmetrisk hvis

f (−t) = f (t) for alle t ∈ R . (15.5)

Page 6: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.2. Den karakteristiske funktion 297

Hvis en konjugeret symmetrisk funktion f er integrabel med hensyn til Lebesguemå-let over et interval af formen [−T,T ], så er

∫ T

−Tf (t) dt ∈ R .

Integralet over et symmetrisk interval er rent reelt. For betingelse (15.5) siger i virke-ligheden at f ’s imaginærdel er en ulige funktion - og ulige funktioner integrerer til 0over intervaller af formen [−T,T ].

Eksempel 15.5 fremstår som en lidt tilfældig observation, men er en nøgle til mangeregninger med karakteristiske funktioner. Vi vil i de kommende afsnit skrive en langrække integraler op, der tilsyneladende er komplekse, men hvor der kan opnås vigtigindsigt ved at bemærke at integranden er konjugeret symmetrisk, så imaginærdelenaf integralet forsvinder.

15.2 Den karakteristiske funktion

Definition 15.6 Lad ν være et sandsynlighedsmål på (R,B). Den karakteristiskefunktion for ν er funktionen φ : R→ C givet som

φ(θ) =∫

ei θx dν(x) for θ ∈ R . (15.6)

Eftersom |ei θx| ≤ 1 for alle værdier af θ og x, er der ingen problemer med integra-biliteten i (15.6). Husker vi definitionen af den komplekse eksponentialfunktion fra(15.1), ser vi at den karakteristiske funktion i virkeligheden er

φ(θ) =∫

cos θx dν(x) + i∫

sin θx dν(x) . (15.7)

Så den karakteristiske funktion er simpelthen en måde at holde styr over alle integra-lerne af de elementære trigonometriske funktioner. Man kunne utvivlsomt holde styrpå disse integraler på mange andre måder, men som vi skal se fører netop dette valgaf bogholderiprincip til et smidigt samspil med kompleks multiplikation.

Page 7: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

298 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

Hvis X er en reel stokastisk variabel taler man ofte om X’s karakteristiske funktionnår man i virkeligheden mener den karakteristiske funktion for X’s fordeling. Dendefinerende formel er altså

φ(θ) =∫

ei θx dX(P)(x) =∫

ei θX dP ,

hvor sidste udtryk fremkommer ved hjælp af integraltransformationssætningen.

Vi kan trivielt konstatere at den karakteristiske funktion φ for et sandsynlighedsmålν opfylder at

φ(0) = 1 , (15.8)

eftersom integranden er konstant 1 i dette tilfælde. Af trekantsuligheden følger end-videre at

|φ(θ)| ≤ 1 for alle θ ∈ R .

Lemma 15.7 Lad ν være et sandsynlighedsmål på (R,B). Den karakteristiske funk-tion φ for ν er konjugeret symmetrisk.

B: Resultatet er en reformulering af det forhold at sinus er en ulige funktion:

φ(−θ) =∫

cos(−θx) dν(x) + i∫

sin(−θx) dν(x)

=

cos θx dν(x) − i∫

sin θx dν(x) = φ(θ) for alle θ ∈ R .

Sætning 15.8 Lad ν være et sandsynlighedsmål på (R,B). Den karakteristiske funk-tion φ for ν er uniformt kontinuert.

B: Lad os indføre hjælpefunktionen ψ : R→ R ved

ψ(∆θ) =∫

∣∣∣ei∆θx − 1

∣∣∣ dν(x) for ∆θ ∈ R .

For alle θ,∆θ ∈ R ser vi at

|φ(θ + ∆θ) − φ(θ)| =∣∣∣∣∣

ei (θ+∆θ)x − ei θx dν(x)∣∣∣∣∣≤

∫ ∣∣∣∣ei θx

(

ei∆θx − 1)∣∣∣∣ dν(x) = ψ(∆θ) .

Page 8: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.2. Den karakteristiske funktion 299

Så hvis vi kan vise at ψ(∆θ) → 0 for ∆θ → 0, så har vi påvist den ønskede uniformekontinuitet. Men ser vi på integranden, kan vi konstatere at

∣∣∣ei∆θx − 1

∣∣∣→ 0 for ∆θ → 0 ,

for alle x ∈ R, domineret af konstanten 2. Så majorantsætningen garanterer at ψ(∆θ)vitterligt går mod nul.

Formelt er der måske tale om en lille stramning i brugen af majorantsætningen: Vibruger en kontinuert variant af sætningen, skønt de kendte formuleringer taler om enfunktionsfølge. Strengt taget har vi vel vist at for en vilkårlig følge (∆θn)n∈N der gårmod nul for n→ ∞, vil der gælde at ψ(∆θn)→ 0.

Men hvis vi et øjeblik antager at ψ(∆θ) ikke går mod nul, så må der findes en følge∆θn, der går mod nul, men sådan at ψ(∆θn) undlader at gå mod nul. Og vi har ligeoverbevist os om at sådan en følge ikke findes.

Sætning 15.9 Lad X være en reel stokastisk variabel med karakteristisk funktion φ.Den stokastiske variabel α + βX har karakteristisk funktion

ψ(θ) = ei θα φ(βθ) for alle θ ∈ R .

B: Beviset er en triviel udregning. Hvis ψ betegner den karakteristiske funktionfor α + βX, så er

ψ(θ) =∫

ei θ(α+βX) dP = ei αθ∫

ei βθX dP = ei αθ φ(βθ) .

Eksempel 15.10 Lad X være en reel stokastisk variabel med karakteristisk funktionφ. Den karakteristiske funktion ψ for −X er ifølge sætning 15.9 givet ved

ψ(θ) = φ(−θ) = φ(θ) ,

hvor vi har brugt at φ er konjugeret symmetrisk. Hvis fordelingen af X er symmetrisk,må ψ = φ, og dermed må φ = φ - altså er φ en rent reel funktion.

Page 9: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

300 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

Omvendt, hvis φ er rent reel, så følger det af disse regninger at ψ = φ. Så X og −X harsamme karakteristiske funktion. Når vi i sætning 15.22 har vist at den karakteristiskefunktion vitterligt karakteriserer en fordeling, følger det derfor at fordelingen af X ersymmetrisk, når den karakteristiske funktion er rent reel.

Eksempel 15.11 Etpunktsmålet εx i x ∈ R har den karakteristisk funktion

φ(θ) = ei θx for θ ∈ R .

Tilsvarende har det empiriske mål εx1,x2,...,xn i punkterne x1, . . . , xn karakteristiskfunktion

φ(θ) =1n

n∑

i=1

ei θxn for θ ∈ R .

Et specielt tilfælde der ofte dukker op i behandlingen af karakteristiske funktioner erdet empiriske mål i de to punkter 1 og -1. Her får vi karakteristisk funktion

φ(θ) =ei θ + e−i θ

2= cos θ for θ ∈ R .

Vi bemærker at denne karakteristiske funktion er rent reel, i god overensstemmelsemed eksempel 15.10.

Eksempel 15.12 Binomialfordelingen med parametre (n, p) har den karakteristiskefunktion

φ(θ) =n∑

k=0

ei θ k(

nk

)

pk(1 − p)n−k =

n∑

k=0

(

nk

)

(ei θp)k (1 − p)n−k =(

ei θp + 1 − p)n.

Specielt har binomialfordelingen med længde n og successandsynlighed 12 karakteri-

stisk funktion

φ(θ) =(

ei θ + 12

)n

= ei nθ/2 cosn(θ/2) .

Hvis S er binomialfordelt med længde n og successandsynlighed 12 , så har variablen

T = 2S − n karakteristisk funktion

ψ(θ) = e−i nθφ(2θ) = cosn θ . (15.9)

Denne karakteristiske funktion dukker op i analysen af en symmetrisk randomwalk, hvor to spillere til hvert heltalligt tidspunkt spiller et fair spil. Ved indgangen

Page 10: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.2. Den karakteristiske funktion 301

til hvert spil lægger begge spillere en fast indsats, og vinderen tager puljen. VariablenT beskriver den samlede gevinst for en af spillerne efter n spil.

Eksempel 15.13 Poissonfordelingen med middelværdi λ har den karakteristiskefunktion

φ(θ) =∞∑

x=0

ei θx λx

x!e−λ =

∞∑

x=0

(ei θλ)x

x!e−λ = eλ(ei θ−1) for θ ∈ R ,

hvor vi har brugt potensrækkefremstillingen for den generelle komplekse eksponen-tialfunktion. Skriver man det ud i detaljer, fører det til noget så eksotisk som itereredetrigonometriske funktioner:

φ(θ) = eλ (cos θ−1) (cos(λ sin θ) + i sin(λ sin θ))

.

Eksempel 15.14 Ligefordelingen over intervallet (a, b) har ifølge eksempel 15.2 denkarakteristiske funktion

φ(θ) =∫ b

a

ei θx

b − adx =

ei bθ − ei aθ

i (b − a) θfor θ ∈ R .

Hvis b > 0 ser vi specielt at ligefordelingen over (−b, b) har den karakteristiskefunktion

φ(θ) =sin bθ

bθ. (15.10)

Denne funktion er rent reel, i god overensstemmelse med eksempel 15.10.◦

Eksempel 15.15 Når man vil finde den karakteristiske funktion for en eksponential-fordeling, er det naturligt at interessere sig for klassen af funktioner af formen

a cos θx e−x + b sin θx e−x ,

hvor a og b har lov at variere frit i R. Denne klasse er stabil over for differentation,idet

ddx

(

a cos θx e−x + b sin θx e−x)

= (bθ − a) cos θx e−x − (aθ + b) sin θx e−x .

Page 11: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

302 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

Ligningssystemetbθ − a = c−(aθ + b) = d

har løsningen

a =−c − dθ1 + θ2 , b =

cθ − d1 + θ2 ,

og derfor er

ddx

(−c − dθ1 + θ2 cos θx e−x +

cθ − d1 + θ2 sin θx e−x

)

= c cos θx e−x + d sin θx e−x . (15.11)

Eksponentialfordelingen med middelværdi 1 har således karakteristisk funktion

φ(θ) =∫ ∞

0cos θx e−x dx + i

∫ ∞

0sin θx e−x

=

[

− cos θx1 + θ2 e−x +

θ sin θx1 + θ2 e−x

]∞

0+ i

[

−θ cos θx1 + θ2 e−x +

− sin θx1 + θ2 e−x

]∞

0

=1

1 + θ2 + iθ

1 + θ2

=1

1 − iθ

Hvis X er eksponentialfordelt med middelværdi 1 vil λX være eksponentialfordeltmed middelværdi λ. Det følger af sætning 15.9 at eksponentialfordelingen med mid-delværdi λ har karakteristisk funktion

φ(θ) =1

1 + λ2θ2 − iλθ

1 + λ2θ2 =1

1 − iλθfor θ ∈ R . (15.12)

Eksempel 15.16 En anden brug af integrationstricket (15.11) er til at finde den ka-rakteristiske funktion for Laplacefordelingen. Denne fordeling er symmetrisk, så denkarakteristiske funktion vil være rent reel. Ser vi på Laplacefordelingen med posi-tionsparameter 0 og skalaparameter 1 får vi den karakteristiske funktion

φ(θ) =∫ ∞

−∞cos θx

12

e−|x| dx =∫ ∞

0cos θx e−x dx

=

[

− cos θx1 + θ2 e−x +

θ sin θx1 + θ2 e−x

]∞

0=

11 + θ2 for θ ∈ R .

Page 12: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.2. Den karakteristiske funktion 303

Eksempel 15.17 Cauchyfordelingen har den karakteristiske funktion

φ(θ) = e−|θ| for θ ∈ R .

Der findes ingen elementære måder at udlede dette resultat på, men vi giver et bevisi eksempel 15.26, når vi har udviklet tilstrækkelig meget teori. Bemærk at dennekarakteristiske funktion har en anden opførsel end hvad vi ellers har set: den har enspids i 0, hvor de karakteristiske funktioner vi har set indtil nu alle har været uendeligofte differentiable.

Eksempel 15.18 Lad f være tætheden for N(0, 1)-fordelingen. Da N(0, 1) er sym-metrisk, er den karakteristiske funktion φ rent reel, og vi ser derfor at

φ(θ) =∫ ∞

−∞cos θx f (x) dx for θ ∈ R .

Bemærk at ∣∣∣∣∣

ddθ

cos θx f (x)∣∣∣∣∣= |−x sin θx f (x)| ≤ |x| f (x) ,

der er integrabel over hele den reelle akse. Ifølge sætning 6.18 er φ derfor differenti-abel overalt med

φ′(θ) = −∫ ∞

−∞sin θx x f (x) dx =

∫ ∞

−∞sin θx f ′(x) dx .

Partiel integration giver at

φ′(θ) =[

sin θx f (x)]∞−∞−

∫ ∞

−∞θ cos θx f (x) dx = −θ φ(θ) .

Differentialligningen φ′(θ) = p(θ)φ(θ) har som bekendt løsninger af formen c eP(θ),hvor P er en stamfunktion til p. Kombineres med betingelsen φ(0) = 1 får vi atN(0, 1) har karakteristisk funktion

φ(θ) = e−θ2/2 for θ ∈ R . (15.13)

Bemærk den forbavsende tætte forbindelse mellem den karakteristiske funktion ogtætheden i dette tilfælde.

Hvis X erN(0, 1)-fordelt så følger ξ+σX enN(ξ, σ2)-fordeling. Kombineres (15.13)med sætning 15.9 ser vi derfor at N(ξ, σ2) har karakteristisk funktion

φ(θ) = ei ξθ e−σ2 θ2/2 for θ ∈ R . (15.14)

Page 13: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

304 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

15.3 Trigonometriske polynomier

Et reelt trigonometrisk polynomium er en funktion p : R→ R af formen

p(θ) = c +n∑

k=1

ak cos kθ + bk sin kθ θ ∈ R

for passende reelle konstanter c, a1, . . . , an og b1, . . . , bn. Det underforstås sædvan-ligvis i denne fremstilling at an og/eller bn er forskellig fra nul, og i så fald sigesgraden af polynomiet at være n. Det er klart at mængden af reelle trigonometriskepolynomier udgør et reelt vektorrum. Funktionerne i dette vektorrum er periodiskemed periode 2π, og de er pæne og glatte. Men derudover er der store variationsmu-ligheder.

Et komplekst trigonometrisk polynomium er en funktion p : R→ C af formen

p(θ) =n∑

k=−n

ckei k θ θ ∈ R

for passende komplekse konstanter c−n, . . . , cn. Hvis c−n og/eller cn er forskellig franul, siges graden af polynomiet at være n. Det er klart at mængden af kompleksetrigonometriske polynomier udgør et komplekst vektorrum.

Et reelt trigonometrisk polynomium kan uden videre opfattes som et komplekst tri-gonometrisk polynomium, for

cos kθ =ei k θ + e−i k θ

2, sin kθ =

ei k θ − e−i k θ

2i,

så hvert af de indgående led i et reelt trigonometrisk polynomium kan opfattes somet komplekst trigonometrisk polynomium.

Men omvendt: hver led i et komplekst trigonometrisk polynomium p(θ) kan skrives

cei k θ = (a + ib)(cos kθ + i sin kθ) = (a cos kθ − b sin kθ) + i(a sin kθ + b cos kθ)

Benyttes denne omskrivning på alle leddene, og samles leddene hensigtsmæssigt, servi at p(θ) kan skrives på formen p1(θ)+ip2(θ), hvor p1 og p2 er reelle trigonometriskepolynomier.

Page 14: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.3. Trigonometriske polynomier 305

Samlet kan man sige at de reelle trigonometriske polynomier netop er de kompleksetrigonometriske polynomier hvis imaginærdel er identisk nul.

I en vis forstand er der ikke den store forskel på at diskutere reelle og komplekse tri-gonometriske polynomier. Den påstand skal dog tages med et gran salt. Geometriskintuition om hvad funktioner “gør” er vanskelig at anvende på komplekse funktioner,så langt hen ad vejen vil vi foretrække de reelle trigonometriske polynomier. Menteknisk set viser de komplekse trigonometriske polynomier sig ofte at være nemmereat arbejde med. At holde sig til reelle trigonometriske polynomier vil derfor være atgøre livet vanskeligt for sig selv. Så selv om vi primært er interesserede i reelle trigo-nometriske polynomier, vil manipulationerne i et vist omfang foregå med kompleksetrigonometriske polynomier.

Eksempel 15.19 Hvis p1(θ) og p2(θ) er reelle trigonometriske polynomier, så erproduktet p1(θ) p2(θ) også et reelt trigonometrisk polynomium. Denne påstand kanprincipielt godt vises direkte: man skal i så fald overbevise sig om at størrelser afformen

cos kθ cos mθ , cos kθ sin mθ , sin kθ sin mθ ,

alle er reelle trigonometriske polynomier. Og det følger af de såkaldte logaritmisketrigonometriske formler.

Men simplere er det dog at indse at produktet af to komplekse trigonometriske po-lynomier selv er et trigonometrisk polynomium. Det kommer nemlig ud på at viseat

eikθeimθ

er et komplekst trigonometrisk polynomium. Men eksponentialfunktionens funktio-nalligning fortæller at

eikθeimθ = ei(k+m)θ ,

så den påstand er triviel. Den tilsvarende reelle påstand fås gratis herudfra, for pro-duktet af to komplekse funktioner, hvis imaginærdel er identisk nul, har selvfølgeligselv imaginærdel identisk nul.

Det er ikke umiddelbart klart at trigonometriske polynomier skulle være værd at be-skæftige sig med, og det var da også en ide der først modnedes omkring år 1800.Det primære skriftsted er Fouriers arbejde om partielle differentialligninger, specieltvarmeledningsligningen. Han demonstrerede f.eks. at varmeudviklingen i en stang,

Page 15: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

306 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

hvis to ender har en fastholdt temperatur på nul, kan forstås ganske nøje hvis tempe-raturen hen igennem stangen til tid t = 0 er et trigonometrisk polynomium. I så faldvil temperaturen til hvert tidspunkt t kunne beskrives som eksponentielt dæmpedesvingninger med de frekvenser, der indgår i det oprindelige polynomium. Ikke blotfastholdes frekvenserne, men man kan vise at højfrekvente svingninger dæmpes hur-tigere end de lavfrekvente. Det har den meget rimelige fysiske fortolkning at lokale“temperaturophobninger” udjævnes med tiden, og at denne udjævning ikke blot er etudtryk for at temperaturen går mod nul - udjævningen sker simpelthen hurtigere endden generelle temperaturdrift.

Fourier var ikke en mand, der lod sig standse af bekymringer om konvergensforhold,så han lod rask væk sine trigonometriske ’polynomier’ have uendeligt mange led,og han postulerede på baggrund af en håndfuld tegninger at ’enhver’ funktion havdeen fremstilling som en uendelig trigonometrisk række. Det tog godt 100 år inden denproblemstilling var endeligt afklaret, og adskillige højt begavede matematikere fik signogle slemme overraskelser undervejs (de første eksempler på intetsteds differenti-able, kontinuerte funktioner, kendt som Weierstrass’ chok, hører til i denne afdeling).

Men succesen i forbindelse med partielle differentialligninger var uomtvistelig, ogsiden har det været et vigtigt værktøj i megen funktionsteori at prøve at tænke påfunktioner som opbygget af svingninger. Fordi disse svingninger gerne har frekvenserder er hele multipla af en grundfrekvens, taler man om harmonisk analyse, når mananlægger denne synsvinkel.

Sætning 15.20 Lad f : [−π, π] → R opfylde at f (−π) = f (π). Hvis f er kontinuertfindes der en følge af reelle trigonometriske polynomier p1, p2, . . . så

supθ∈[−π,π]

| f (θ) − pn(θ)| → 0 for n→ ∞ .

B: Betingelsen om f ’s opførsel i de to endepunkter sikrer at der findes en entydigtbestemt funktion F : S 1 → R (hvor S 1 er enhedscirklen i R2) der opfylder at

F(cos θ, sin θ) = f (θ) for alle θ ∈ [−π, π] .

Da f er kontinuert ser vi at F er kontinuert. Og der findes derfor ifølge sætning 13.34en følge af polynomier qn i to variable så

sup(x,y)∈S 1

|qn(x, y) − F(x, y)| → 0 for n→ ∞ .

Page 16: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.3. Trigonometriske polynomier 307

Hvis punktet (cos θ, sin θ) indsættes i et polynomium∑

k,` ak `xk y` af to variable fås∑

k,`

ak` cosk θ sin` θ .

Hver led er ifølge eksempel 15.19 et reelt trigonometrisk polynomium, og derfor erhele kombinationen et reelt trigonometrisk polynomium i θ. Og tydeligvis har vi at

supθ∈[−π,π]

|qn(cos θ, sin θ) − f (θ)| = sup(x,y)∈S 1

|qn(x, y) − F(x, y)| → 0 for n→ ∞ .

For en kontinuert funktion (og for en række diskontinuerte funktioner med, for densags skyld) f : [−π, π] → R med f (−π) = f (π), taler man gerne om “funktionensFourierrække af grad n” som det komplekse trigonometriske polynomium pn(θ) =∑n

k=−n ckeikθ , hvor

ck =1

∫ π

−πf (θ)e−ikθ dθ

Disse trigonometriske polynomier minimerer L2-afstanden til f , og som regel harde også en meget lille uniform afstand til f . Der findes meget ubehagelige eksemp-ler, hvor en funktions Fourierrække ikke konvergerer punktvist mod funktionen selv.Men der skal være et eller andet helt degenereret på færde - mange meget skarpespidser, f.eks. Og i fald det skulle kikse med funktionens Fourierrække, er der altsåifølge sætning 15.20 andre trigonometriske polynomier, der ligger uniformt tæt vedfunktionen.

I denne diskussion af trigonometriske polynomier har intervallet [−π, π] spillet enspeciel rolle. Vi har set at de trigonometriske polynomier kunne beskrive stort sethvad som helst inden i dette interval. Men periodiciteten gør at de umuligt kan sigenoget særligt interessant om hvad der sker på større intervaller. I beviset for Weier-strass’ approksimationssætning stod vi med et tilsvarende problem: vi kunne approk-simere uniformt med polynomier på enhedsintervallet, men ønskede at approksimerepå andre intervaller også. Vi løste problemet ved at flytte det interval vi interesseredeos for ind i [0, 1] ved en affin transformation. Vi kan gøre det samme nu, men prisener en generalisering af hvad der skal forstås ved et trigonometrisk polynomium.

Hvis f : [−K,K]→ R er kontinuert og opfylder at f (−K) = f (K), så er det naturligtat se på funktionen

θ 7→ f(K θ

π

)

for θ ∈ [−θ, θ] .

Page 17: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

308 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

Vi approksimerer denne funktion med et reelt trigonometrisk polynomium,

q(t) =N∑

k=−N

ck ei k t .

Vender vi tilbage til det oprindelige f , ser vi at det approksimeres uniformt over[−K,K] af

θ 7→ q(π θ

K

)

=

N∑

k=−N

ck ei π k θ/K for θ ∈ [−K,K] .

Vi ledes derfor til at betragte generaliserede trigonometriske polynomier af formen

N∑

k=1

ck eiαk θ

hvor c1, . . . , cN er komplekse tal, og hvor α1, . . . , αN er vilkårlige reelle tal. Og dennaturlige udvidelse af sætning 15.20 til at dække funktioner defineret på et vilkårligtinterval siger at hvis f : [−K,K] → R er kontinuert og opfylder at f (−K) = f (K),så kan vi finde en følge af generaliserede trigonometriske polynomier, der approksi-merer f uniformt over [−K,K]. Vi kan uden problemer antage at disse generaliseredetrigonometriske polynomier har imaginærdel nul.

Korollar 15.21 Lad f : R → R være en kontinuert, begrænset funktion. For hvertK > 0 findes en følge af generaliserede reelle trigonometrisk polynomier p1, p2, . . .

såsup

θ∈[−K,K]| f (θ) − pn(θ)| → 0 for n→ ∞ .

Vi kan antage at‖pn‖ ≤ ‖ f ‖ + 1 for alle n ∈ N .

B: Her og i det følgende bruger vi konventionen

‖ f ‖ = supθ∈R| f (θ)|

når f er en begrænset funktion. Man kan bemærke at et generaliseret trigonometriskpolynomium er begrænset, for

∣∣∣∣∣∣∣

N∑

k=1

ck ei αk θ

∣∣∣∣∣∣∣

≤N∑

k=1

|ck | for alle θ ∈ R .

Page 18: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.3. Trigonometriske polynomier 309

B: Når der overhovedet er noget at vise, er det fordi vi ikke har nogen antagelseder sikrer at f ’s værdi i K og −K skulle være den samme. Men det er ikke noget stortproblem: find en bumpfunktion g (se afsnit 13.7) der opfylder at

[−K,K] ≺ g ≺(

−K − 1,K + 1)

og sætf̃ (θ) = g(θ) f (θ) for alle θ ∈ R .

Den nye funktion f̃ er kontinuert, og den er identisk 0 uden for det åbne interval(−K − 1,K + 1). Specielt opfylder den at

f̃ (−K − 1) = f̃ (K + 1) = 0 .

Endvidere er f̃ lig med f på intervallet [−K,K] hvor vores hovedinteresse ligger, ogendelig er ‖ f̃ ‖ ≤ ‖ f ‖.

Vi kan nu finde en følge af ’ægte’ trigonometriske polynomier, q1, q2, . . ., så

supθ∈[−π,π]

∣∣∣∣∣∣f̃(

(K + 1)θπ

)

− qn(θ)

∣∣∣∣∣∣→ 0 for n→ ∞ .

Disse q’er er periodiske med periode 2π, så de antager deres numerisk største værdieri intervallet [−π, π]. Ved i værste fald at droppe de første endeligt mange q’er, ser viat

‖qn‖ ≤ ‖ f̃ ‖ + ‖ f̃ − qn‖ ≤ ‖ f̃ ‖ + 1 ≤ ‖ f ‖ + 1 .

De generaliserede trigonometriske polynomier

rn(θ) = qn

(πθ

K + 1

)

(15.15)

opfylder atsup

θ∈[−K−1,K+1]

∣∣∣ f̃ (θ) − rn(θ)

∣∣∣→ 0 for n→ ∞ .

Og da

supθ∈[−K,K]

| f (θ) − rn(θ)| = supθ∈[−K,K]

| f̃ (θ) − rn(θ)| ≤ supθ∈[−K−1,K+1]

∣∣∣ f̃ (θ) − rn(θ)

∣∣∣ ,

har vi vist det ønskede.�

På baggrund af disse resultater om uniform approksimation med trigonometriske po-lynomier, er vi nu i stand til at vise at den karakteristiske funktion for et sandsynlig-hedsmål på R vitterligt karakteriserer målet.

Page 19: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

310 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

Sætning 15.22 Lad ν og λ være to sandsynlighedsmål på (R,B), med karakteristiskefunktioner φ henholdsvis ψ. Hvis φ = ψ, så er ν = λ.

B: Vi viser at antagelsen om at ν og λ har samme karakteristiske funktion med-fører at

f dν =∫

f dλ for alle f ∈ Cb(R) , (15.16)

hvor Cb(R) betegner systemet af kontinuerte, begrænsede reelle funktioner defineretpå R. At ν og λ er samme sandsynlighedsmål, følger herefter af sætning 13.35.

Lad q(θ) =∑N

k=1 ck ei αk θ være et generaliseret trigonometrisk polynomium. Da er

q(θ) dν(θ) =N∑

k=1

ck

ei αk θ dν(θ) =N∑

k=1

ckφ(αk) .

Vi ser at ν-integralet af et generaliseret trigonometrisk polynomium er givet ved denkarakteristiske funktion. Da ν og λ har samme karakteristiske funktion, har vi altså at

q(θ) dν(θ) =∫

q(θ) dλ(θ) .

Så lad f være en Cb(R)-funktion. Ifølge korollar 15.21 kan vi finde generaliseredetrigonometriske polynomier q1, q2, . . . så

supθ∈[−n,n]

| f (θ) − qn(θ)| < 1n

og så ‖gn‖ ≤ ‖ f ‖ + 1 for alle n. Vi ser heraf at qn(θ) → f (θ) for alle θ, majoriseret af‖ f ‖ + 1, og majorantsætningen fortæller os at

qn dν→∫

f dν for n→ ∞.

Samme type grænseresultat gælder for λ-integraler, og derfor har vi at∫

f dν = limn→∞

qn dν = limn→∞

qn dλ =∫

f dλ .

Page 20: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.4. Omvendingsintegraler 311

Sætning 15.22 er forholdsvis ukonstruktiv, fordi den trækker en ret indirekte forbin-delse mellem karakteristisk funktion og sandsynlighedsmål. Men i løbet af bevisethar vi faktisk lært en hel del mere, og det er vigtigt at opsamle den viden.

Kendskab til den karakteristiske funktions værdier i de hele tal, altså til φ(z) hvor zgennemløber Z, er tilstrækkelige til at finde integralet af ethvert ’ægte’ trigonome-trisk polynomium. Og det fremgår af sætning 15.20, måske kombineret med nogleovervejelser om bumpfunktioner, at det er nok til at kunne fastlægge sandsynligheds-målets opførsel på intervallet [−π, π]. Hvis vi ønsker at studere sandsynlighedsmåletsopførsel på [−2π, 2π] har vi lært at presse intervallet sammen til [−π, π], foretage detrigonometriske approksimationer på dette interval, og derefter blæse op igen. Denneteknik viser at kendskab til den karakteristiske funktion på gitteret Z/2 er tilstrække-ligt til at fastlægge sandsynlighedsmålets opførsel på [−2π, 2π].

Helt generelt er kendskab til den karakteristiske funktion på gitteret Z/K tilstrækkeligtil at fastlægge sandsynlighedsmålets opførsel på intervallet [−Kπ,Kπ]. Hvis vi vilvide hvordan ν opfører sig på et meget bredt interval, må vi altså kende φ’s værdierpå et meget fint gitter. Den centrale lære at drage af denne observation er, at infor-mationen om ν’s opførsel i de ekstreme haler kan uddrages af hvordan φ ændrer sigover meget små intervaller - hvis der ikke er noget spændende at sige om disse lokaleændringer, behøver vi ikke noget fint gitter for at få fastlagt målet over det hele. Vived at φ er uniformt kontinuert - men det efterlader jo stadig forskellige mulighederfor lokale oscillationer. Halesandsynlighederne vil i høj grad været karakteriseret vedom φ f.eks. er differentiabel eller ej.

Det viser sig uvægerligt at de største lokale forskelle i den karakteristiske funktionsopførsel opstår inde omkring 0. Vi skal i afsnit 15.5 præsentere en række resultater,der giver kød på princippet om at et sandsynlighedsmåls opførsel i den ekstreme haleer bestemt af hvor kraftigt den karakteristiske funktion oscillerer lokalt om 0.

15.4 Omvendingsintegraler

Hvis man finder at den indirekte forbindelse mellem sandsynlighedsmål og karak-teristisk funktion i sætning 15.22 er for svag, så kan man måske værdsætte de så-kaldte omvendingsintegraler, der forholdsvis eksplicit udtrykker sandsynlighedenfor f.eks. intervaller i termer af den karakteristiske funktion. De nødvendige kon-struktioner er dog så komplicerede at de ikke rigtigt lader sig gennemføre i praksis,

Page 21: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

312 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

og derfor er omvendingsintegralerne ikke så meget et praktisk værktøj som de er enæstetisk tilfredsstillelse. Til overflod er de ganske vanskelige at vise: populært sagtbestår problemerne i at man skal integrere ikke-integrable funktioner. . . Det kan manselvfølgelig ikke, og man må foretage sig en lang række krumspring for at undgå atstå i den situation.

Lemma 15.23 Der gælder at∫ x

0

sin tt

dt → π

2for x→ ∞ .

B: Man indser uden det store problem at funktionen sin t/t ikke er integrabelover hele den reelle akse, så eksistensen af en grænseværdi er en ganske delikat sag.Men disse integraler dukker op i mange sammenhænge, så det er et vigtigt naturhi-storisk faktum at grænsen eksisterer og har værdien π/2.

Når resultatet er så vigtigt, så findes der naturligvis adskillige beviser - men ingen afdem kan kaldes elementære. Et bevis der baseres på kompleks analyse og i særdeles-hed på residuesætningen findes i Rudin (1987). Et andet bevis i almindelig cirkulationer baseret på integration af den såkaldte Dirichletkerne fra Fourierrækketeori. Vi gi-ver her et tredie bevis, der baseres på en inspireret brug af Fubinis sætning.

B: Betragt funktionen f : (0,∞) × (0,∞)→ R givet ved

f (t, y) = sin t e−ty .

For x > 0 er funktionen m2-integrabel over den lodrette stribe af formen (0, x) × R.Hvis vi udnytter at | sin t| ≤ |t| har vi nemlig at

∫ x

0

∫ ∞

0| f (t, y)| dy dt ≤

∫ x

0

∫ ∞

0te−ty dy dt =

∫ x

01 dt = x .

Fubinis sætning tillader os derfor at udregne integralet af f over striben ved successivintegration. Det kan vi gøre på to måder der adskiller sig ved integrationsrækkefølgen,og de to måder må føre til samme resultat. Først ser vi at

∫ x

0

∫ ∞

0sin t e−ty dy dt =

∫ x

0

sin tt

dt ,

Page 22: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.4. Omvendingsintegraler 313

så f -integralet er bestemt relevant i forhold til at vise det ønskede resultat. For detandet kan vi bruge integrationstricket (15.11) til at indse at

∫ ∞

0

∫ x

0sin t e−ty dt dy =

∫ ∞

−∞

∫ xy

0sin

zy

e−z 1y

dz dy

=

∫ ∞

0

[

−y1 + y2 cos

zy

e−z +−y2

1 + y2 sinzy

e−z]xy

0

1y

dy

=

∫ ∞

0

−11 + y2 cos x e−xy +

−y1 + y2 sin x e−xy +

11 + y2 dy .

Bemærk at ∫ ∞

0

11 + y2 dy =

[

arctan y]∞0=π

2,

så vi har nu vist at∣∣∣∣∣

∫ x

0

sin tt

dt − π2

∣∣∣∣∣=

∣∣∣∣∣∣

∫ ∞

0

−11 + y2 cos x e−xy +

−y1 + y2 sin x e−xy dy

∣∣∣∣∣∣

≤ 2∫ ∞

0e−xy dy =

2x,

hvilket medfører det ønskede.�

Vi har brug for et par små varianter af dette resultat. For det første findes der enkonstant C så ∣

∣∣∣∣

∫ x

0

sin tt

dt∣∣∣∣∣≤ C for alle x ∈ R . (15.17)

Lemma 15.23 klarer de store x’er, og da integranden er begrænset er der ingen pro-blemer inde omkring 0. For det andet viser en elementær substitution at

limx→∞

∫ x

−x

sin γtt

dt =

π hvis γ > 0

0 hvis γ = 0−π hvis γ < 0

.

Sætning 15.24 Lad ν være et sandsynlighedsmål på (R,B) med karakteristisk funk-tion φ. For a < b gælder der at

limT→∞

12π

∫ T

−T

e−i ta − e−i tb

i tφ(t) dt = ν

(

(a, b))

+ν(

{a})

+ ν(

{b})

2. (15.18)

Page 23: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

314 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

B: Læserens første forbløffelse har sikkert at gøre med den måde punktsand-synlighederne i de to intervalendepunkter dukker op i grænsen. Men det er ikke rig-tigt til at undgå at det kommer til at se sådan ud, der er en vis udjævningseffekt i atintegrere kontinuerte funktioner. Betragter man kun intervaller, hvis endepunkter erkontinuitetspunkter for ν, så forsvinder punktsandsynlighederne naturligvis fra form-len.

Næste forbløffelse rettes nok mod at integralerne skal være så komplicerede. Hvisman viste at

12π

∫ T

−T

−e−i tb

i tφ(t) dt (15.19)

konvergerer mod ν(

(−∞, b))

+ ν(

{b})

/2, så kunne man opnå (15.18) ved at trækketo integraler fra hinanden, hvis man skulle have lyst til det. Men skønt det projektvirker mere overskueligt, så løber det ind i grimme problemer. Sagen er at integra-lerne (15.19) ikke eksisterer! Integranden opfører sig som i/t inde omkring nul. Menved at trække to funktioner af den type fra hinanden, så får man - som vi skal se - enfunktion frem, der faktisk kan integreres.

B: Vi holder a og b fast, og indfører funktionen

g(t) =e−i t a − e−i t b

i t. (15.20)

Det følger af eksempel 15.2 at

|g(t)| =∣∣∣∣∣∣

∫ b

ae−i t y dy

∣∣∣∣∣∣≤

∫ b

a

∣∣∣e−i t y

∣∣∣ dy = b − a

så g er begrænset, og der er ingen problemer med eksistensen af integralerne i (15.18).Bemærk iøvrigt at g er konjugeret symmetrisk ligesom φ. Derfor er produktet af demkonjugeret symmetrisk, og af eksempel 15.5 følger det at integralerne i (15.18) alleer reelle.

Når man indsætter definitionen af den karakteristiske funktion i (15.18) ser man atintegralerne i virkeligheden er dobbeltintegraler af formen

12π

∫ T

−T

g(t) ei tx dν(x) dt .

Ideen er at bytte om på integrationsordenen i dette dobbeltintegral. Det tillader Fubi-nis sætning os at gøre, fordi

∫ T

−T

∫∣∣∣ g(t) ei t x

∣∣∣ dν(x) dt ≤

∫ T

−T

(b − a) dν(x) dt = (b − a) 2T < ∞ .

Page 24: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.4. Omvendingsintegraler 315

Foretager vi ombytningen, ser vi at de nye inderintegraler bliver∫ T

−Tg(t) ei t x dt =

∫ T

−T

ei (x−a) t − ei (x−b) t

i tdt =

∫ T

−T

sin(x − a) tt

dt−∫ T

−T

sin(x − b) tt

dt

hvor vi har skaffet os af med imaginærdelene under henvisning til den konjugeredesymmetri. Lader vi T → ∞, ser vi at de to integraler konvergerer mod samme grænsehvis x − a og x − b har samme fortegn, dvs. hvis x < [a, b], og derfor vil differensenkonvergere mod nul. Hvis vi derimod ser på et x ∈ (a, b) vil første integral konvergeremod π mens andet integral konvergerer mod − π, og differensen konvergerer mod 2π.Endelig overbeviser man sig om at differensen konvergerer mod π i de to specielletilfælde x = a og x = b. Opsummeret har vi at

∫ T

−Tg(t) ei t x dt →

0 hvis x < [a, b]

π hvis x = a eller x = b

2π hvis x ∈ (a, b),

og denne konvergens er majoriseret af 2C, hvor C er konstanten fra (15.17). Derfortillader majorantsætningen os at konkludere at

∫ ∫ T

−Tg(t) ei t x dt dν(x) →

2π1(a,b)(x) + π1{a,b}(x) dν(x) for T →∞ .

Dette resultat oversættes hurtigt til (15.18).�

Korollar 15.25 Lad ν være et sandsynlighedsmål på (R,B) med karakteristisk funk-tion φ. Hvis φ er integrabel med hensyn til Lebesguemålet m, så har ν tæthed medhensyn til m. Faktisk er ν = f · m hvor

f (x) =1

e−i x t φ(t) dt for alle x ∈ R . (15.21)

Denne tæthed er begrænset og uniformt kontinuert.

B: Lad os starte med at konstatere at integranden i definitionen af f er konjuge-ret symmetrisk, så f er vitterligt en reel funktion. Det er klart at f er begrænset af∫

|φ(t)| dt. Vi ser også at

| f (x + ∆x) − f (x)| =∣∣∣∣∣

∫(

e−i (x+∆x) t − e−i x t)

φ(t) dt∣∣∣∣∣≤

∫∣∣∣e−i∆x t − 1

∣∣∣ |φ(t)| dt ,

Page 25: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

316 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

så den uniforme kontinuitet af f følger analogt med argumentet i sætning 15.8.

Lad a < b være to kontinuitetspunkter for ν, og lad g(t) være funktionen fra (15.20).Idet

1(−T,T )(t) g(t) φ(t) → g(t) φ(t) for T → ∞ ,

majoriseret af den integrable funktion (b − a) |φ(t)|, følger det af majorantsætningenat inverteringsformlen tager udseendet

ν(

(a, b))

=1

g(t) φ(t) dt =∫ ∫ b

a

12π

e−i t x φ(t) dx dt ,

hvor vi har brugt at g(t) kan skrives som et integral. Eftersom

∫ ∫ b

a

∣∣∣∣∣

12π

e−i t x φ(t)∣∣∣∣∣

dx dt =b − a

|φ(t)| dt < ∞ ,

tillader Fubinis sætning os at bytte om på integrationsordenen, og vi opnår at

ν(

(a, b))

=

∫ b

a

∫1

2πe−i t x φ(t) dt dx =

∫ b

af (x) dx . (15.22)

Der er kun tælleligt mange diskontinuitetspunkter for ν, så intervallerne af formen(a, b), hvor både a og b er kontinuitetspunkter, udgør et fællesmængdestabilt frem-bringersystem for B.

Bemærk at f ikke kan være negativ. For hvis f (x0) < 0 så ville kontinuiteten med-føre at f var negativ på et interval (x0 − ε, x0 + ε). I dette interval ville der findeskontinuitetspunkter a < b for ν. Af (15.22) ville det nu følge at (a, b) havde negativtν-mål.

Ved at bruge (15.22) på to følger (an)n∈N og (bn)n∈N af kontinuitetspunkter for ν, derkonvergerer mod henholdsvis −∞ og ∞ for n→ ∞, giver monotonisætningen at

f (x) dx = limn→∞

∫ bn

an

f (x) dx = limn→∞

ν(

(an, bn))

= 1 .

Vi ved derfor at f · m er et sandsynlighedsmål, og kombineres (15.22) med entydig-hedssætningen, ser vi at ν = f · m.

Page 26: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.5. Haleopførslen 317

Vi har tidligere set at den karakteristiske funktions opførsel inde om 0 bestemmersandsynlighedsmålet i den ekstreme hale. Her ser vi det modsatte forhold: den karak-teristiske funktions opførsel i halen (der jo er bestemmende for om den er integrabeleller ej) siger noget om sandsynlighedsmålets variation over meget små intervaller.

Eksempel 15.26 Vi husker fra eksempel 15.16 at Laplacefordelingen har karakteri-stisk funktion (1 + θ2)−1. Denne karakteristiske funktion er m-integrabel, og skrivervi (15.21) op, får den udseendet

e−|x| =1

e−i t x 11 + t2 dt .

Ganske overraskende kan vi identificere integralet på højre side af dette lighedstegnsom den karakteristiske funktion for Cauchyfordelingen! Og vi har dermed vist atden karakteristiske funktion for Cauchyfordelingen er

φ(θ) = e−|θ| for θ ∈ R ,

sådan som det blev postuleret i eksempel 15.17. Der findes ingen elementære måderat vise dette resultat på.

15.5 Haleopførslen

I dette afsnit vil vi give resultater, hvor vi siger noget om et sandsynlighedsmålshaleopførsel ud fra den karakteristiske funktion. Det første resultat er ganske groft,men vil være af stor betydning i senere kapitler.

Sætning 15.27 Lad ν være et sandsynlighedsmål på (R,B) med karakteristisk funk-tion φ. For alle u > 0 gælder at

ν

([

−2u,

2u

]c)

≤ 1u

∫ u

−u(1 − φ(θ)) dθ . (15.23)

B: Integranden på højre side af uligheden er konjugeret symmetrisk, så integraleter rent reelt. Det ses derfor at

1u

∫ u

−u(1 − φ(θ)) dθ =

1u

∫ u

−u

1 − cos θx dν(x) dθ .

Page 27: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

318 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

Integranden i dette dobbeltintegral er numerisk mindre end 2, så Fubinis sætningtillader os at ombytte integrationsordenen. Vi får

1u

∫ u

−u(1 − φ(θ)) dθ =

1u

∫ ∫ u

−u1 − cos θx dθ dν(x) = 2

∫ (

1 − sin uxux

)

dν(x)

Integranden her er ikke-negativ, og vi ser at

1 − sin uxux

≥ 12

når |x| ≥ 2u.

Heraf følger det ønskede.�

Et mere raffineret resultat knytter momenterne for et sandsynlighedsmål sammen meddets karakteristiske funktion.

Sætning 15.28 Lad ν være et sandsynlighedsmål på (R,B) med karakteristisk funk-tion φ. Hvis ν har k’te moment, så er φ en Ck-funktion og

φ(k)(θ) = ik∫

xk ei θ x dν(x) for θ ∈ R . (15.24)

B: Når vi siger at den komplekse funktion φ er Ck, betyder det naturligvis atsåvel real- som imaginærdel er Ck-funktioner. Bemærk hvordan (15.24) tillader os atfinde ν’s k’te moment ved at sætte θ = 0:

φ(k)(0) = ik∫

xk dν(x) .

B: Vi ser først på tilfældet k = 1. Vi har at∣∣∣∣∣

ddθ

cos θx∣∣∣∣∣= |−x sin θx| ≤ |x| .

Da |x| er ν-integrabel, følger det af sætning 6.17 at

ddθ

cos θx dν(x) = −∫

x sin θx dν(x) .

Page 28: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.6. Laplacetransformationer 319

Tilsvarende kan det vises atddθ

sin θx dν(x) =∫

x cos θx dν(x) ,

Kombineres disse to resultater ser vi at φ er differentiabel, og at

φ′(θ) = −∫

x sin θx dν(x) + i∫

x cos θx dν(x)

= i(∫

x cos θx dν(x) + i∫

x sin θx dν(x))

= i∫

x ei θ x dν(x) .

At den afledte er kontinuert (endda uniformt kontinuert) følger analogt med argumen-tet i sætning 15.8.

De tilsvarende resultater om de afledte af højere orden følger induktivt ved at vise ogudnytte at

ddθ

xk−1 cos θx dν(x) = −∫

xk sin θx dν(x) ,

ddθ

xk−1 sin θx dν(x) =∫

xk cos θx dν(x) ,

når ν har k’te moment.�

Alle eksemplerne i afsnit 15.2 på nær ét viser karakteristiske funktioner, der er eruendelig ofte differentiable - i god overensstemmelse med at de tilhørende sandsyn-lighedsmål alle har momenter af vilkårlig orden. Den eneste undtagelse fra dette møn-ster er den karakteristiske funktion for Cauchyfordelingen i eksempel 15.17, der ikkeer differentiabel i 0 - men Cauchyfordelingen har jo heller ikke 1. moment. Bemærkdog at den karakteristiske funktion for Cauchyfordelingen faktisk er differentiabelalle andre steder end i 0, så det er kun helt inde i 0 at de tunge haler for alvor mani-festerer sig.

15.6 Laplacetransformationer

I dette afsnit vil vi præsentere to konstruktioner, der er inspireret af de karakteristi-ske funktioner. De er nok endnu mindre intuitive, og de giver i øvrigt kun mening

Page 29: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

320 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

for visse sandsynlighedsmål. Men når man kan slippe af sted med at bruge dem, såer det ofte en fordel, for de er simplere at have med at gøre rent regneteknisk - deundgår brugen af trigonometriske funktioner og komplekse tal. Og de involverer eks-ponentialfunktionen på en måde, der gør at det centrale foldningstrick - se afsnit 18.5- fungerer på samme måde som for karakteristiske funktioner.

Definition 15.29 Lad ν være et sandsynlighedsmål på (R,B) sådan at ν(

[0,∞))

= 1.Den Laplacetransformerede af ν er funktionen ψ : [0,∞)→ R givet som

ψ(θ) =∫ ∞

0e−θ x dν(x) for θ ∈ [0,∞) . (15.25)

Vi ser at Laplacetransformationen ψ har værdier i (0, 1]. Hvis X er en stokastisk vari-abel med værdier i [0,∞) taler man ofte om den Laplacetransformerede af X når mani virkeligheden mener den Laplacetransformerede af X’s fordeling. Den definerendeformel er altså

ψ(θ) =∫ ∞

0e−θ x dX(P)(x) =

e−θX dP ,

hvor sidste udtryk fremkommer ved hjælp af integraltransformationssætningen.

For sandsynlighedsmål ν på N0 falder det ofte for at bruge den såkaldte frembrin-gende funktion. Hvis ν har punksandsynligheder p0, p1, . . . er den frembringendefunktion

µ(x) =∞∑

n=0

pn xn .

Denne potensrække er konvergent på den afsluttede enhedskugle i den komplekseplan, og derfor kan vi uden problemer opfatte µ som værende defineret på [0, 1]. Mankan bemærke at

µ(x) =∞∑

n=0

pn en log x = ψ(− log x) for alle x ∈ (0, 1) ,

hvor ψ er den Laplacetransformerede. Så den frembringende funktion er simpelthenden Laplacetransformerede i nogle lidt andre gevandter.

Page 30: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.6. Laplacetransformationer 321

Sætning 15.30 Lad X være en stokastisk variabel med værdier i [0,∞) og med La-placetransformeret ψ. Hvis α, β ≥ 0 så har den stokastiske variabel α + βX karakte-ristisk funktion

υ(θ) = e−θα ψ(βθ) for alle θ ∈ [0,∞) .

B: Som den tilsvarende relation for karakteristiske funktioner er denne egenskabganske triviel. Hvis υ betegner den karakteristiske funktion for α + βX, så er

υ(θ) =∫

e−θ(α+βX) dP = e−αθ∫

e−βθX dP = e−αθ φ(βθ) .

Eksempel 15.31 Binomialfordelingen med parametre (n, p) har Laplacetransforme-ret

ψ(θ) =(

e−θp + 1 − p)n

for θ ∈ [0,∞) .

som det ses analogt med regningerne i eksempel 15.12. Den frembringende funktionbliver derfor

µ(x) = (xp + 1 − p)n for x ∈ [0, 1] .

Eksempel 15.32 Poissonfordelingen med middelværdi λ har Laplacetransformeret

ψ(θ) = eλ(e−θ−1) for θ ∈ [0,∞) .

som det ses analogt med regningerne i eksempel 15.13. Den frembringende funktionbliver derfor

µ(x) = eλ(x−1) for x ∈ [0, 1] .

Eksempel 15.33 Den negative binomialfordeling med parametre (r, p) har Laplace-transformeret

ψ(θ) =pr

(

1 − (1 − p)e−θ)r for θ ∈ [0,∞) .

Page 31: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

322 Kapitel 15. Deskriptiv teori: den karakteristiske funktion

Den frembringende funktion bliver derfor

µ(x) =pr

(1 − (1 − p)x

)r for x ∈ [0, 1] .

Eksempel 15.34 Γ-fordelingen med formparameter λ har Laplacetransformeret

ψ(θ) =∫ ∞

0e−θx 1Γ(λ)

xλ−1e−λ dx =1Γ(λ)

∫ ∞

0xλ−1 e−(1+θ) x dx =

1(1 + θ)λ

.

Sætning 15.35 Lad ν1 og ν2 være to sandsynlighedsmål på (R,B) der begge giversandsynlighed 1 til [0,∞). Lad de to mål have Laplacetransformeret ψ1 og ψ2. Hvisψ1 = ψ2 så vil ν1 = ν2.

B: Betragt afbildningen g : R→ R givet ved

g(x) = e−x .

De to billedmål g(ν1) og g(ν2) giver da sandsynlighed 1 til enhedsintervallet [0, 1].Og momenterne kan udregnes ud fra de oprindelige Laplacetransformerede, f.eks. er

xk d(g(ν1))(x) =∫

g(x)k dν1(x) = ψ1(k) .

Når ν1 og ν2 har samme Laplacetransformerede, må g(ν1) og g(ν2) derfor have desamme momenter. Det følger af sætning 13.36 at g(ν1) = g(ν2). At ν1 og ν2 også erens, følger ved at tilbagetransformere med − log x.

Sætning 15.36 Lad ν være et sandsynlighedsmål på (R,B) sådan at ν([0,∞)

)= 1,

og lad ψ være den Laplacetransformerede. På det åbne interval (0,∞) er ψ uendeligtofte differentiabel med

ψ(k)(θ) = (−1)k∫ ∞

0xk e−θ xdν(x) for θ ∈ (0,∞), k ∈ N . (15.26)

Page 32: Deskriptiv teori: den karakteristiske funktionweb.math.ku.dk/~erhansen/stat2A_04/doku/noter/kap15.pdfKapitel 15 Deskriptiv teori: den karakteristiske funktion Når man forsłger at

15.6. Laplacetransformationer 323

B: Følger af sætning 6.17 ved induktion efter k. Man skal blot bemærke at enhverfunktion af typen x 7→ xk e−θx er begrænset.

Det følger af monotonisætningen at

−ψ′(θ) =∫ ∞

0x e−θ x dν(x) →

∫ ∞

0x dν(x) for θ → 0+.

Grænseintegralet er veldefineret, men det kan eventuelt være ∞. Heraf slutter vi at ψer differentiabel fra højre i 0 hvis ν har 1. moment. Men også omvendt: hvis ν ikkehar 1. moment, så er ψ ikke differentiabel fra højre i 0.

Tilsvarende bemærkninger gælder for de højere afledede, og det adskiller Laplace-transformationen en smule fra de karakteristiske funktioner: den karakteristiske funk-tion kan i princippet være glattere end hvad antallet af momenter garanterer, mensman rent faktisk kan aflæse af den Laplacetransformeredes glathed i 0 hvor mangemomenter målet har.