Click here to load reader

Deskriptiv teori: momenter - math.ku.dkerhansen/stat2A_04/doku/noter/kap13.pdf · Kapitel 13 Deskriptiv teori: momenter Vi vil i dette og det fłlgende kapitel indfłre en række

  • View
    220

  • Download
    1

Embed Size (px)

Text of Deskriptiv teori: momenter - math.ku.dkerhansen/stat2A_04/doku/noter/kap13.pdf · Kapitel 13...

  • Kapitel 13

    Deskriptiv teori: momenter

    Vi vil i dette og det flgende kapitel indfre en rkke begreber der bruges til atbeskrive sandsynlighedsml p (R,B). Samtlige begreber udspringer i en eller andenforstand af at man regner integraler ud af visse funktioner.

    Man skal have tre slags sandsynlighedsml p R i tankerne: Dels ml med tthedmed hensyn til Lebesguemlet m. Dels ml der er koncentreret p Z, men som altstnkes indlejret i R. Og dels empiriske ml, alts ml af formen

    x1,...,xn(A) =1n

    n

    i=1

    1A(xi)

    hvor x1, . . . , xn er givne tal i R.

    Vi vil altid tnke p et sandsynlighedsml p (R,B) som fordelingen af en stoka-stisk variabel X, defineret p et baggrundsrum (,F, P). Denne synsvinkel forekom-mer naturlig, hvis har tthed med hensyn til m eller lever p Z.

    Men tankegangen kan faktisk ogs give god mening i forbindelse med empiriske ml:hvis et oprindeligt eksperiment, beskrevet ved reelle stokastiske variable X1, . . . , Xn,har givet vrdier x1, . . . , xn, konstruerer man i visse situationer bootstrapvariableX1, X

    2 , . . . der netop har fordelingen x1,...,xn . Man bruger ogs ordet resampling, fordi

    Xn netop er en genudtrkning af en tilfldig af de oprindelige mlinger. Det er vigtigtat forst at resampling er noget man selv laver (p sin computer). Men alligevel kanresampling i hj grad bruges til at vinde indsigt i det oprindelige eksperiment.

    232

  • 13.1. Momenter 233

    13.1 Momenter

    Definition 13.1 Lad vre et sandsynlighedsml p (R,B), og lad k N. Vi siger at har kte moment hvis funktionen x 7 xk er -integrabel. I bekrftende fald kaldes

    xk d(x)

    for det kte moment af , mens

    |x|k d(x)

    kaldes det kte absolutte moment af .

    I almindelighed vil vi hellere tale om stokastiske variable end om sandsynligheds-ml. For en reel stokastisk variabel, X, defineret p et baggrundsrum (,F, P), er vitilbjelige til at identificere egenskaberne for X med egenskaberne for fordelingen afX, alts billedmlet X(P) p (R,B). Vi vil sledes sige at X har kte moment, nr vi ivirkeligheden mener at X(P) har kte moment. Det sker nr

    |x|k dX(P)(x) < .

    Bemrk at integraltransformationsformlen sikrer at

    |X|k dP =

    |x|k dX(P)(x) .

    Der glder alts at X har kte moment netop hvis den transformerede stokastiskevariabel Xk er P-integrabel. I bekrftende fald taler vi lige s gerne - eller hellere -om kte moment af X som om det kte moment af X(P), sknt den sidste formuleringer den formelt korrekte.

    For stokastiske variable er der tradition for at skrive 1. momentet

    EX =

    X dP

    hvor E er en forkortelse af det engelske expectation. P dansk bruges ofte ordetmiddelvrdi for 1. momentet. Tilsvarende skrives EXk for det kte moment og E|X|k

  • 234 Kapitel 13. Deskriptiv teori: momenter

    for det kte absolutte moment. Integraltransformationsformlen fortller os at hvis detkte moment for X eksisterer, kan det findes som

    EXk =

    xk dX(P)(x) =

    Xk dP

    alts ved at integrere den stokastiske variabel Xk med hensyn til P.

    Eksempel 13.2 Lad X vre en reel stokastisk variabel, defineret p et baggrundsrum(,F, P). Hvis X er nsten sikkert begrnset, det vil sige hvis

    P(|X| N) = 1

    for et passende N, s har X kte moment for alle k. For

    |X|k dP

    Nk dP = Nk.

    Eksempel 13.3 Lad X vre en reel stokastisk variabel, defineret p et baggrundsrum(,F, P), og antag at fordelingen af X har tthed f med hensyn til Lebesguemletm. Lad t : (R,B) (R,B) vre en mlelig transformation. Integraltransformations-formlen giver at

    |t X| dP =

    |t(x)| dX(P)(x) =

    |t(x)| f (x) dx .

    Den stokastiske variabel t(X) har derfor middelvrdi hvis og kun hvis

    |t(x)| f (x) dx < . (13.1)

    I bekrftende fald fr man - ligeledes ud fra integraltransformationsformlen - at

    E(t(X)

    )=

    t(x) f (x) dx. (13.2)

    Eksempel 13.4 Lad X vre en reel stokastisk variabel, defineret p et baggrundsrum(,F, P). Antag at P(X Z) = 1, og lad fordelingen af X have sandsynlighedsfunk-tion p. Lad t : (R,B) (R,B) vre en mlelig transformation. Den stokastiske

  • 13.1. Momenter 235

    variabel t(X) har middelvrdi hvis og kun hvis

    n=|t(n)| p(n) < (13.3)

    og i bekrftende fald er

    E(

    t(X))

    =

    n=t(n) p(n) . (13.4)

    Eksempel 13.5 Lad X vre en reel stokastisk variabel, defineret p et baggrundsrum(,F, P), og antag at X(P) = x1 ,...,xn . Lad t : (R,B) (R,B) vre en mleligtransformation. Den stokastiske variabel t(X) har altid middelvrdi, og

    E(

    t(X))

    =1n

    n

    i=1

    xt(i) . (13.5)

    Eksempel 13.6 En rkke studerendes hjde er blevet mlt, resultaterne er angivet itabel 13.1.

    Kvinder Mnd159.8 166.8 170.1 169.9 181.1 185.0159.8 167.2 170.2 172.4 181.8 187.1159.9 168.7 172.0 176.7 181.8 188.0162.0 168.8 175.0 176.7 182.0 189.9163.9 169.0 175.8 176.8 183.0 190.3164.9 169.0 176.9 177.1 183.1 192.7165.0 169.1 178.1 178.0 183.9 196.7165.0 169.7 178.7 178.9 184.0165.2 170.0 180.1 180.0 185.0165.9 170.0 183.0 180.2 185.0

    Tabel 13.1: Hjdemlinger for 57 studerende, fordelt p kn. Resultaterne er angivet i cm.Et dotplot over disse data er optegnet i figur 13.1.

    Ser man p dotplottet over disse data i figur 13.1 fr man en tydelig fornemmelseaf at mndene er hjere end kvinderne (hvilket vist ikke kommer bag p nogen).

  • 236 Kapitel 13. Deskriptiv teori: momenter

    Hjde

    150 160 170 180 190 200

    Mnd

    Kvinder

    Figur 13.1: Et dotplot for data fra tabel 13.1.

    Det er ikke sdan at alle mndende er hjere end alle kvinderne, men den typiskemand er hjere end den typiske kvinde. Denne lse betragtning kan til en vis gradprciseres gennem brug af empiriske momenter:

    EX EX2 EX3 EX4

    Kvinder 169.32 28 704.596 4 872 318.5804 828 069 444.5778

    Mnd 182.49 33 335.431 6 095 891.7873 1 115 894 089.7778

    De empiriske momenter for mndene er strre end for kvinderne - for de hjeremomenter endda voldsomt meget strre. Middelvrdierne svarer nogenlunde til hvorjet finder sit centrum i de to dotplot. S at mndenes middelvrdi er hjere endkvindernes, svarer til den visuelle konklusion om at mndene er strst. Fortolkningenaf de hjere momenter er mere usikker, men vil blive taget op igen i eksempel 13.15.

    Momenterne af en fordeling giver en forholdsvis grov beskrivelse, men et sted skalman jo starte. Vi skal se at visse modifikationer af momenterne er at foretrkke: deer nemmere at forholde sig til, fordi de ikke generes af de numeriske problemer, derer tydelige i eksempel 13.6. Vi skal ogs i afsnit 13.7 se at sknt momenterne kunudgr en simpel opsummering af fordelingens egenskaber, s er det dog under visseomstndigheder nok til at identificere fordelingen entydigt.

  • 13.2. Egenskaber ved middelvrdien 237

    13.2 Egenskaber ved middelvrdien

    Lemma 13.7 Lad X vre en reel stokastisk variabel, defineret p et baggrundsrum(,F, P), og antag at X har 1. moment. For alle , R glder at + X har1. moment, og

    E( + X

    )= + EX. (13.6)

    B: Frst konstaterer vi at

    | + X| dP

    || + |||X| dP = || + ||

    |X| dP < ,

    s + X har vitterligt 1. moment. Formlen for E( + X

    )flger nu af integralets

    linearitet:

    E(

    + X)

    =

    + X dP = +

    X dP = + EX.

    Lemma 13.8 Lad X vre en reel stokastisk variabel, defineret p et baggrundsrum(,F, P), og antag at X har 1. moment. Lad I vre et reelt interval. Hvis P(X I) =1, s vil EX I.

    B: Antag frst at P(X a) = 1. Da er

    EX =

    X dP

    a dP = a.

    Vi kan endda se at der glder skarp ulighed, medmindre P(X = a) = 1. Hvis vi vedat P(X > a) = 1, kan vi derfor slutte at EX > a.

    Helt tilsvarende kan vi vise at hvis P(X b) = 1 s er EX b, og hvis P(X < b) = 1s er EX < b.

    Argumentationen i lemma 13.8 kan strammes op til at sige at EX er et indre punkt iI, medmindre X er udartet i det ene endepunkt.

  • 238 Kapitel 13. Deskriptiv teori: momenter

    Lemma 13.9 Lad X vre en reel stokastisk variabel, defineret p et baggrundsrum(,F, P), og antag at X har kte moment. For ethvert m = 1, . . . , k glder at X harmte moment.

    B: For alle x R har vi at|x|m 1 + |x|k,

    hvor 1-tallet skal sikre at uligheden ogs holder for |x| < 1. Der glder dermed

    |X()|m 1 + |X()|k for alle .

    Denne ulighed skrives sdvanligvis blot

    |X|m 1 + |X|k (13.7)

    hvor argumentet ikke skrives ud eksplicit. Integreres p begge sider af (13.7) fs

    |X|m dP 1 +

    |X|k dP <

    som nsket.

    En konsekvens af lemma 13.9 er at hvis X har kte moment, s har ethvert polyno-mium i X af grad k eller mindre middelvrdi. Hvis X har kte moment, definerer videt kte nedstigende faktorielle moment EX (k) som

    EX(k) = EX(X 1) . . . (X k + 1) .

    For stokastiske variable med vrdier i Z er det ofte nemmere at udregne det ktenedstigende faktorielle moment end det er at udregne det kte moment. Se eksem-pel 13.17 og 13.18.

    Lemma 13.10 Lad X og Y vre to reelle stokastiske variable, defineret p et bag-grundsrum (,F, P). Hvis bde X og Y har kte moment, s har X + Y ogs ktemoment.

    B: For alle x, y R har vi at

    |x + y| |x| + |y| 2 max{|x|, |y|}.

  • 13.2. Egenskaber ved middelvrdien 239

    Da x 7 xk er voksende p [0,), er

    |x + y|k 2k max{|x|, |y|}k = 2k max{|x|k , |y|k} 2k(|x|k + |y|k).

    Dermed er

    |X + Y |k 2k(|X|k + |Y |k),

    og integreres p begge sider af denne ulighed, opns at

    |X + Y |k dP 2k(

    |X|k dP +

    |Y |k dP)

    < .

    Lemma 13.11 (Markovs ulighed) Lad X vre en reel stokastisk variabel, defineretp et baggrundsrum (,F, P). Antag at P(X 0) = 1 og at X har 1. moment. Foralle c > 0 glder da at

    P(X > c) EXc. (13.8)

    B: For alle x 0 har vi at

    c 1(c,)(x) x.

    Dermed vil

    c 1(c,)(X) X P n.s.

    Integreres i denne ulighed fs som nsket at

    c P(X > c) EX.

    Det fremgr af Markovs ulighed, at for en reel variabel X er E|X| et udtryk for hvorhurtigt halesandsynlighederne P(|X| > c) gr mod nul for c .

  • 240 Kapitel 13. Deskriptiv teori: momenter

    13.3 Standardiserede momenter

    Hvis X har kte moment, indfrer vi det kte moment om c som

    E(X c)k

    Ganges (X c)k ud, fs et polynomium i X af grad k, og da alle ledene er integrable,giver definitionen mening.

    Det kte centrale moment af X er det kte moment om c = EX. Alts

    E(X EX)k.

    De centrale momenter er som oftest meget nemmere at fortolke end de r momen-ter. Det centrale 2. moment kaldes variansen af X, og skrives VX. Alts

    VX = E(X EX)2. (13.9)

    Lemma 13.12 Lad X vre en reel stokastisk variabel, defineret p et baggrundsrum(,F, P). Antag at X har 2. moment. Da glder at

    VX = EX2 (EX)2. (13.10)

    Endvidere glder der atVX = EX(2) (EX)(2), (13.11)

    og for alle c R glder at

    E(X c)2 = VX + (EX c)2 . (13.12)

    B: Iflge (13.12) kan EX karakteriseres som det punkt hvorom X har det mind-ste 2. moment. Det giver substans til flelsen af at EX er en slags centrum for forde-lingen af X.

    B: Ved udregning af kvadratet i (13.9) fs:

    VX = E(X EX)2 = E(X2 2XEX + (EX)2)= EX2 2EXEX + (EX)2 = EX2 (EX)2,

  • 13.3. Standardiserede momenter 241

    og dermed er (13.10) bevist. Beviset for (13.11) er stort set det samme, og overladestil lseren. Endelig ser vi at

    E(X c)2 = E((X EX) + (EX c))2

    = E(X EX)2 + (EX c)2 + 2E((X EX)(EX c))= E(X EX)2 + (EX c)2 + 0.

    En anden nyttig regneregel er at

    V( + X) = 2VX. (13.13)

    Den flger igen ved simple regninger:

    V( + X) = E( + X E( + X))2 = E( + X ( + EX))2

    = E((X EX))2 = 2E(X EX)2 = 2VX.

    Lemma 13.13 Lad X vre en reel stokastisk variabel, defineret p et baggrundsrum(,F, P), og antag at X har 2. moment. Da er VX 0. Og VX = 0 hvis og kun hvisX = EX P-nsten sikkert.

    B: Det fremgr af (13.9) at VX er integralet af den ikke-negative funktion (X EX)2. Derfor er VX 0. Og vrdien kan kun vre nul, hvis variablen (X EX)2 ernul nsten sikkert, alts hvis X = EX nsten sikkert.

    Lemma 13.14 (Chebyshevs ulighed) Lad X vre en reel stokastisk variabel, defi-neret p et baggrundsrum (,F, P), og antag at X har 2. moment. For ethvert > 0glder at

    P(|X EX| > ) VX2

    . (13.14)

    B: Lad Y = (X EX)2. Markovs ulighed, brugt p Y og c = 2, giver at

    P(Y > 2) EY2.

  • 242 Kapitel 13. Deskriptiv teori: momenter

    Men dette er faktisk det nskede udsagn, da

    P(Y > 2) = P(|X EX| > )

    og daEY = E(X EX)2 = VX.

    Chebyshevs ulighed er - p trods af resultatets simpelhed - meget vigtig i teoretiskesammenhnge. Men bndet er ikke optimalt. I praksis vil halesandsynlighederne gmod nul langt hurtigere end funktionen 2.

    Nr man betragter hjere ordens momenter, vil man ofte standardisere variablenfrst. Det betyder at man danner den nye stokastiske variabel

    Y =X EX

    VX.

    Nvneren

    VX kaldes spredningen eller standardafvigelsen og betegnes gernemed bogstavet . Spredningen er et relativt intuitivt ml for hvor meget X variereromkring sin middelvrdi, fordi spredningen (i modstning til variansen) er mlt psamme skala som X. Den konstruerede Y-variabel er en affin transformation af Xsdan at

    EY = 0, VY = 1.

    De hjere ordens momenter af Y er en slags geometriske karakteristika for fordelin-gen af X, karakteristika der ikke afhnger af den skala man har mlt X p.

    Hvis X har 3. moment, definerer vi skvheden af X, skrevet (X), som

    (X) = EY3.

    Og hvis X har 4. moment, definerer vi kurtosis af X, skrevet (X), som

    (X) = EY4 3.

    Hvis X er normalfordelt, s er (X) = (X) = 0. Den primre brug af skvhed ogkurtosis for en given fordeling, er netop at udtrykke i hvilken forstand fordelingenafviger fra en normalfordeling. Hvis X har en positiv kurtosis, taler man om lepto-kurtosis. Det betyder at fordelingen har en tungere hale end normalfordelingen, ogdet er noget man er meget p vagt over for.

    Eksempel 13.15 Vi kan udregne de standardiserede empiriske momenter for hjde-mlingerne fra eksempel 13.6.

  • 13.4. Eksempler 243

    Middelvrdi Spredning Skvhed Kurtosis

    Kvinder 169.3 5.9 0.43 -0.38

    Mnd 182.5 5.9 0.22 0.10

    Med to betydende cifre er de standardiserede momenter ganske ens for de to kn,bortset fra at middelvrdierne er forskellige. Det er i god overensstemmelse med detvisuelle udtryk fra figur 13.1, hvor observationerne for de to kn ligger spredt pnogenlunde samme mde omkring de to midtpunkter. Bde skvhed og kurtosis erstort set nul for begge kn. Vi ser alts at de store forskelle i de r momenter, som vikonstaterede i eksempel 13.6 primrt skyldes forskellen i middelvrdi.

    Man skal vre opmrksom p at der er numeriske flder ved at arbejde med empi-riske momenter. De hjere momenter er ofte meget store, og bruger man (13.10) tilat regne variansen ud, kommer man til at trkke to store tal fra hinanden. Eftersomde to tal gerne er af samme strrelsesorden, kommer resultatet til at afhnge af denederste cifre - som mske primrt er udtryk for kumulerede regnefejl! Derfor strman sig ofte ved at bruge selve definitionen (13.9) fremfor (13.10), for den er knaps flsom over for numeriske fejl. Disse betragtninger glder i endnu hjere grad forskvhed og kurtosis, som br regnes ud direkte fra definitionen, og ikke via de r 3.og 4. momenter.

    13.4 Eksempler

    Eksempel 13.16 Da

    |x|k 12

    ex22 dx < for alle k N0 har normalfordelingen

    momenter af kte orden for ethvert k N0. Nr k er ulige, er det kte moment 0, ognr k er lige, fr man

    xk1

    2e

    x22 dx =

    2k1

    2

    2

    (

    x2

    2

    ) k+12 1

    ex22 xdx =

    2k2

    0y

    k+12 1eydy

    =2

    k2

    (

    k + 12

    )

    = (k 1)(k 3) 3 1.

    Specielt er middelvrdien 0 og variansen 1. Det flger da af (13.6) og (13.13),at den normale fordeling med parametre (, 2) har middelvrdi og varians 2.

  • 244 Kapitel 13. Deskriptiv teori: momenter

    Eksempel 13.17 Binomialfordelingen med parametre (n, p) har kte moment forethvert k N0, og det kte nedstigende faktorielle moment udregnes ved

    n

    x=0

    x(k)(

    nx

    )

    px(1 p)nx =n

    x=k

    n!(x k)! (n x)! p

    x(1 p)nx

    =

    nk

    x=0

    n!x! (n k x)! p

    x+k(1 p)nxk

    = n(k) pknk

    x=0

    (

    n kx

    )

    px(1 p)nxk

    = n(k) pk.

    Middelvrdien er sledes np, og iflge (13.11) er variansen

    n(2) p2 (np)(2) = np(1 p).

    Eksempel 13.18 Den negative binomialfordeling med parametre (r, p) har kte mo-ment for ethvert k N0, og det kte nedstigende faktorielle moment udregnes ved

    x=0

    x(k)(

    rx

    )

    pr(p 1)x =

    x=k

    (r)(x)(x k)! p

    r(p 1)x

    =

    x=0

    (r)(x+k)x!

    pr(p 1)x+k

    = (r)(k)(

    p 1p

    )k

    x=0

    (

    r kx

    )

    pr+k(p 1)x

    = (r)(k)(

    p 1p

    )k

    .

    Middelvrdien er alts r 1pp , og iflge (13.11) er variansen

    (r)(2)(

    1 pp

    )2

    (

    r1 p

    p

    )(2)

    = r1 p

    p2. (13.15)

  • 13.4. Eksempler 245

    Eksempel 13.19 Poissonfordelingen med parameter har kte moment for ethvertk N0, og det kte nedstigende faktorielle moment udregnes ved

    x=0

    x(k)x

    x!e =

    x=k

    x

    (x k)! e = k

    x=0

    x

    x!e = k.

    Middelvrdien er sledes og iflge 13.11 er variansen 2 (2) = .

    Eksempel 13.20 -fordelingen med formparameter har kte moment for ethvertk N0, og det kte moment udregnes ved

    0xk

    1()

    x1exdx =( + k)()

    = ( + k 1)(k).

    Middelvrdien er sledes , og variansen er iflge (13.10)

    ( + 1)(2) 2 = .

    Specielt har eksponentialfordelingen k! som kte moment og 1 som middelvrdi ogvarians. -fordelingen med formparameter og skalaparameter > 0 har kte mo-ment k( + k 1)(k) og sledes middelvrdi og varians 2. 2-fordelingen medf frihedsgrader har alts middelvrdi f og varians 2 f .

    Eksempel 13.21 B-fordelingen med formparameter (1, 2) har kte moment forethvert k N0, og det kte moment udregnes ved

    1

    0xk

    1B(1, 2)

    x11(1 x)21dx = B(1 + k, 2)B(1, 2)

    =(1 + k 1)(k)

    (1 + 2 + k 1)(k).

    Middelvrdien er sledes 11+2

    og iflge (13.10) er variansen

    (1 + 1)(2)

    (1 + 2 + 1)(2)

    (

    1

    1 + 2

    )2

    =12

    (1 + 2)2(1 + 2 + 1).

    Nr 1 = 2 = er middelvrdien 12 og variansen1

    4(2+1) . Ligefordelingen p (0,1)( = 1) har derfor middelvrdi 12 og varians

    112 . Det flger af (13.6) og (13.13), at

    ligefordelingen p [, + ] har middelvrdi + 2 og varians2

    12 .

  • 246 Kapitel 13. Deskriptiv teori: momenter

    Eksempel 13.22 F-fordelingen med formparametre (1, 2) har kte moment for

    k < 2, thi

    0 xk

    11

    22

    B(1,2)x11

    (1 x+2)1+2dx er endeligt, hvis og kun hvis k < 2. Det kte

    moment for k < 2 udregnes ved

    0xk

    11

    22

    B(1, 2)x11

    (1x + 2)1+2dx

    =k2

    k1

    1B(1, 2)

    0

    (

    1 x1 x + 2

    )1+k1 ( 21x + 2

    )2k1 12(1 x + 2)2

    dx

    =k2

    k1

    1B(1, 2)

    1

    0y1+k1(1 y)2k1dy

    =k2

    k1

    B(1 + k, 2 k)B(1, 2)

    =

    (

    2

    1

    )k (1 + k 1)(k)(2 1)(k)

    .

    Nr 2 > 1 eksisterer middelvrdien sledes og er lig med221 . For 2 > 2 eksisterer

    variansen, og iflge (13.10) er variansen

    (

    2

    1

    )2 (1 + k 1)(2)(2 1)(2)

    (

    2

    2 1

    )2

    =22(2 + 1 1)

    1(2 1)2(2 2). (13.16)

    Eksempel 13.23 t-fordelingen med formparameter har kte moment for k < 2, thiintegralet

    |x|k 1

    2B(, 1/2)

    1

    (1 + x2

    2 )+ 12

    dx

    er endeligt hvis og kun hvis k < 2. Specielt har Cauchyfordelingen ikke middel-vrdi. Det kte moment for k < 2 er 0, nr k er ulige, og nr k er lige, er det ktemoment iflge eksempel 12.11 lig det k/2 moment i F-fordelingen med formpara-metre (2, ). Det vil sige at det kte moment i t-fordelingen for k lige er

    (2)k2

    ( k12 )( k2 )

    ( 1)( k2 ).

    Nr > 12 eksisterer middelvrdien sledes og er 0. For > 1 eksisterer variansen,og er lig med

    1 .

  • 13.4. Eksempler 247

    Eksempel 13.24 Den logaritmiske normalfordeling med parametre (0, 2) har ktemoment for ethvert k N0, og det kte moment udregnes ved

    0

    1

    2yk1e

    (log y)2

    22 dy =1

    2

    ekze

    z2

    22 dz

    =1

    2e

    2 k22

    e

    122

    (zk2)2 dz = e2 k2

    2 .

    Den logaritmiske normalfordeling med parametre (, 2) har kte moment

    exp(

    2k2

    2+ k

    )

    og sledes middelvrdi og varians henholdsvis

    exp(

    2

    2+

    )

    og(exp(2) 1) exp(2 + 2) .

    Eksempel 13.25 Den hypergeometriske fordeling med parametre (n,N1,N) har ktemoment for ethvert k N0, og det kte nedstigende faktorielle moment udregnes ved

    n

    x=0

    x(k)(

    nx

    )

    N1(x)(N N1)(nx)N(n)

    =

    n

    x=k

    n(x)

    (x k)!N1(x)(N N1)(nx)

    N(n)

    =

    nk

    x=0

    n(x+k)

    x!N1(x+k)(N N1)(n(x+k))

    N(n)

    =n(k)N1(k)

    N(k)

    nk

    x=0

    (n k)(x)x!

    (N1 k)(x)(N k (N1 k))(nkx)(N k)(nk)

    =n(k)N1(k)

    N(k).

    Middelvrdien er sledes nN1N og variansen er iflge (13.11)

    1N 1

    nN

    (

    1 nN

    )

    N1(N N1) = nN1N

    (

    1 N1N

    ) (

    1 n 1N 1

    )

    = N1nN

    (

    1 nN

    ) (

    1 N1 1N 1

    )

    .

  • 248 Kapitel 13. Deskriptiv teori: momenter

    13.5 Jensens ulighed

    Der glder en lang rkke uligheder mellem integraler. Forbavsende mange af disse- ofte klassiske - uligheder kan fs frem som specialtilflde af flgende stning:

    Stning 13.26 (Jensens ulighed) Lad X vre en reel stokastisk variabel, defineretp et baggrundsrum (,F, P), og lad f : R R vre en mlelig funktion. Hvisf er konveks p et interval I, hvis P(X I) = 1, og hvis svel X som f (X) harmiddelvrdi, s glder at

    f (EX) E( f (X)). (13.17)

    Hvis f er strengt konveks p I, er der lighedstegn netop hvis fordelingen af X erudartet i punktet EX.

    B: Iflge korollar C.13 fra Appendix C er mlelighedsantagelsen p f stort setoverfldig. Restriktionen af f til det indre af I vil p grund af konveksitet automatiskvre kontinuert. Hvis f ikke er kontinuert p hele I, s kan den i vrste fald skrivessom en tuborgfunktion, der deler op i det indre af I og et eller to af Is endepunk-ter. Det fremgr at f s restriktion til I er B |I-mlelig under alle omstndigheder.Hvordan f ser ud uden for I er irrelevant for (13.17).

    B: Vi ved at EX I, og det flger af beviset for lemma 13.8 at EX er et indrepunkt i I, medmindre fordelingen af X er udartet i et af endepunkterne. Hvis X erkonstant nsten sikkert, glder (13.17) oplagt - endda med lighedstegn.

    Vi antager derfor at EX er et indre punkt i I. Iflge stning C.14 fra Appendix Cfindes et a, sledes at

    f (EX) + (X EX)a f (X), (13.18)og (13.17) flger af denne ulighed ved at tage middelvrdi p begge sider.

    Hvis der er lighedstegn i (13.17), er der lighedstegn i (13.18) med sandsynlighed 1,og hvis f er strengt konveks, er dette ensbetydende med, at P(X = EX) = 1.

    Eksempel 13.27 Bruges Jensens ulighed p den konvekse funktion f (x) = x2, fr viat

    EX2 (EX)2

  • 13.5. Jensens ulighed 249

    for enhver reel stokastisk variabel X med 2. moment. Der glder endda skarp ulig-hed, medmindre X er udartet. Det vidste vi udmrket i forvejen, sammenholdes med(13.10) har vi blot gjort rede for at VX 0. Sknt dette eksempel ikke er dybsindigt,kan det tjene som en huskeregel for hvordan Jensens ulighed vender.

    Eksempel 13.28 Bruges Jensens ulighed p den konvekse funktion f (x) = 1x , ser viat for en ikke-udartet stokastisk variabel med vrdier i (0,) er

    E(

    1X

    )

    >1

    EX

    hvis begge momenter eksisterer.

    Eksempel 13.29 Bruges Jensens ulighed p en stokastisk variabel X med fordelingx1,...,xn , hvor x1, . . . , xn > 0, og p funktionen f (x) = log x, der er veldefineret ogkonveks p (0,), fs at

    log

    1n

    n

    i=1

    xi

    1n

    n

    i=1

    log(xi) = 1n

    log

    n

    i=1

    xi

    .

    Tages eksponentialfunktionen p begge sider af denne ulighed, fs at

    1n

    n

    i=1

    xi

    n

    i=1

    xi

    1/n

    ,

    og vi har sledes bevist at den aritmetiske middelvrdi af x1, . . . , xn er strre endden geometriske middelvrdi.

    Korollar 13.30 Hvis X har kte moment og 0 < m < k er(

    E(|Xm|))1m (E(|Xk |))

    1k .

    B: Eftersom km > 1 er funktionen x xkm konveks p [0,). Derfor er

    (E(|X|m))

    km E((|X|m) km ) = E(|X|k).

  • 250 Kapitel 13. Deskriptiv teori: momenter

    13.6 Weierstrass approksimationsstning

    Mange stninger om mlelige funktioner vises efter et firetrinsskema, hvor manfrst viser stningen for indikatorfunktioner, dernst for simple funktioner, dernstfor M+-funktioner, og endelig for M-funktioner. Udvidelsen fra indikatorfunktio-ner til simple funktioner er som regel triviel, ligesom det ikke volder vanskelighederat komme fra M+ til M. Vanskelighederne ligger i overhovedet at komme i gang- alts at vise resultatet for indikatorfunktioner - og i at udnytte den approksima-tionsteknik, der ligger gemt i korollar 4.33, hvorM+-funktioner approksimeres medS+-funktioner.

    I andre omrder af den reelle analyse er det naturlige startpunkt for at vise stningerom funktioner R R ikke simple funktioner, men polynomier. Og sprgsmlet erofte hvor langt man kan udvide resultater, der er mere eller mindre oplagte for poly-nomier. Men andre ord: hvilke funktioner f : R R kan approksimeres godt medpolynomier? En kendt og elsket form for approksimation foregr med Taylorpolyno-mier. Her vlger man polynomier, der er meget, meget gode approksimationer lokaltomkring et udviklingspunkt. Ideen med at erstatte en funktion med et passende Tay-lorpolynomium har fejret spektakulre triumfer siden Newton demonstrerede densrkkevidde.

    Men dels virker metoden kun for glatte funktioner. Og dels betyder fokuseringen pfunktionens helt lokale opfrsel, at approksimationens kvalitet over strre strk m-ske daler. Weierstrass valgte en helt anden indgangsvinkel, hvor han fokuserede papproksimationens kvalitet over et p forhnd valgt omrde. Hans approksimations-stning er et hovedresultat i den reelle analyse. Sknt stningen ikke har et sandsyn-lighedsteoretisk indhold, kan man overraskende nok give et bevis hvor Chebyshevsulighed er den centrale ingrediens

    Stning 13.31 (Weierstrass) Lad f : [a, b] R vre en kontinuert reel funktion,defineret p et kompakt interval. Der findes en flge af reelle polynomier, (pn(x))nN,sdan at

    supx[a,b]

    | f (x) pn(x)| 0 for n .

    B: Lad os i frste omgang antage at [a, b] = [0, 1]. Vi vil simpelthen angive enflge af eksplicitte polynomier, de skaldte Bernsteinpolynomier, og vise at disse

  • 13.6. Weierstrass approksimationsstning 251

    polynomier har den nskede egenskab. Nr vi ikke anfrer Bernsteinpolynomiernei stningens formulering, er det fordi der er mange andre polynomiumsflger medtilsvarende egenskaber - og Bernsteinpolynomierne approksimerer faktisk ikke srliggodt i praksis.

    For hvert n N indfrer vi Bernsteinpolynomiet pn relateret til f som

    pn(x) =n

    k=0

    f(

    kn

    ) (

    nk

    )

    xk (1 x)nk . (13.19)

    For at bevise at disse polynomier approksimerer f uniformt, lader vi > 0 vre givet.Idet f er uniformt kontinuert p [0, 1], findes et > 0 sdan at

    | f (x) f (y)| < for alle x, y [0, 1] , |x y| < .

    St f = sup

    x[0,1]| f (x)| ,

    og tag et n s stort at f

    2 n 2< . (13.20)

    Vi pstr at for et n, der opfylder (13.20), vil der glde at

    | f (x) pn(x)| < 2 for alle x [0, 1] .

    Vi iklder beviset for denne pstand sandsynlighedsteoretiske fjer. Lad os betragte etfast x [0, 1]. Lad S n vre en stokastisk variabel, der er binomialfordelt med lngden og successandsynlighed x. Vi ser at

    E f(S n

    n

    )

    =

    n

    k=0

    f(

    kn

    )

    P(S n = k) = pn(x) .

    Dermed er

    | f (x) pn(x)| =f (x)

    f(S n

    n

    )

    dP=

    f (x) f(S n

    n

    )

    dP

    =

    (|S n/nx|

  • 252 Kapitel 13. Deskriptiv teori: momenter

    Kobler vi dette med den trivielle ulighedf (x) f

    (S nn

    ) 2 f ,

    der glder overalt, og derfor specielt p (|S n/n x| ), ser vi at

    | f (x) pn(x)| P(|S n/n x| < ) + 2 f P(|S n/n x| ) .

    Den frste sandsynlighed er mindre end 1, den anden sandsynlighed kan vurderesved hjlp af Chebyshevs ulighed. Herved fr vi at

    | f (x) pn(x)| +2 f V(S n/n)

    2

    Det nskede resultat flger, nr man erindrer variansen for en binomialfordeling:

    V(S n/n) =VS nn2=

    nx(1 x)n2

    14 n

    .

    Lad os nu fjerne antagelsen om at [a, b] er det lukkede enhedsinterval. Udvidelsen tilandre intervaller baseres p to simple observationer: For det frste glder der at hvis : [a, b] [c, d] er en bijektiv funktion mellem to intervaller, s er

    supx[a,b]

    |g (x) h (x)| = supy [c,d]

    |g(y) h(y)| ,

    for alle funktioner g og h defineret p [c, d]. For det andet glder der at sammenst-ningen af to polynomier igen er et polynomium. Lad vre den affine funktion

    (x) = a + (b a) x for x R .

    Vi ser at afbilder [0, 1] bijektivt p [a, b]. Funktionen f = f er kontinuert p[0, 1], og kan derfor approksimeres uniformt med en flge af polynomier, p1, p2, . . ..Vi stter pn = pn 1. Da 1 er affin er pn et polynomium. Og der glder at

    supx[a,b]

    | f (x)pn(x)| = supy[0,1]

    | f (y)pn(y)| = supy[0,1]

    | f (y) pn(y)| 0 for n .

    Eksempel 13.32 Lad os prve at se p en konkret anvendelse af den approksima-tionsmetode, der angives i beviset for stning 13.31. Som testfunktion bruger vif (x) = sin 2x, som vi nsker approksimeret over intervallet [0, 1]. P figur 13.2er Bernsteinpolynomierne fra (13.19) tegnet op for fire forskelle vrdier af n.

  • 13.6. Weierstrass approksimationsstning 253

    Bernsteinpolynomiets grad: 15

    1 0 1 2

    21

    01

    2

    Bernsteinpolynomiets grad: 30

    1 0 1 2

    21

    01

    2

    Bernsteinpolynomiets grad: 45

    1 0 1 2

    21

    01

    2

    Bernsteinpolynomiets grad: 60

    1 0 1 2

    21

    01

    2

    Figur 13.2: Fire approksimerende Bernsteinpolynomier til f (x) = sin 2x, udregnet ef-ter (13.19). Disse polynomier approksimerer f uniformt over intervallet [0, 1] - til gengldapproksimerer de ikke srlig godt uden for enhedsintervallet.

    Det ser vitterligt ud som om disse polynomier approksimerer f ganske godt i inter-vallet [0, 1]. Til gengld kan man f det indtryk at jo bedre f bliver approksimeretinden for [0, 1], jo vrre er approksimationen udenfor. . . Der er i hvert fald grnserfor hvor langt ud polynomierne kan approksimere, for ethvert polynomium gr mod for x , mens vores testfunktion er begrnset.

    At der kan vre forskel p hvornr approksimationer er gode lokalt, og hvornr de ergode globalt er i nogen grad i modstrid med en tankefigur, der ofte anvendes i forbin-delse med Taylorpolynomier: Hvis en Taylorapproksimation er drlig i det omrdeman skal bruge den, tilfjer man gerne nogle hjere ordens led til approksimationen.Det fr approksimationen til at blive endnu bedre helt inde omkring udviklingspunk-tet - og s hber man at denne forgede kvalitet flger med ud til det omrde, hvorman skulle bruge approksimationen. Figur 13.2 illustrerer at denne mde at tnke phar sine begrnsninger.

  • 254 Kapitel 13. Deskriptiv teori: momenter

    Taylorpolynomiets grad: 5

    1 0 1 2

    21

    01

    2Taylorpolynomiets grad: 10

    1 0 1 2

    21

    01

    2

    Taylorpolynomiets grad: 15

    1 0 1 2

    21

    01

    2

    Taylorpolynomiets grad: 20

    1 0 1 2

    21

    01

    2

    Figur 13.3: Fire approksimerende Taylorpolynomier til f (x) = sin 2x, udregnet ef-ter (13.21). Bemrk at graden af de anvendte polynomier er langt mindre end graden afde Bernsteinpolynomier, der indgr i figur 13.2. Alligevel ser vi at Taylorpolynomierne ap-proksimerer godt over et langt strre omrde end Bernsteinpolynomierne.

    Nu vi alligevel taler om Taylorpolynomier, kan vi prve at se hvad der sker ved atanvende den sdvanlige Taylorudvikling om 0 for sin x. Vi bruger alts polynomierne

    qn(x) =[(n+1)/2]

    k=1

    (1)k1 (2x)2k1

    (2k 1)! . (13.21)

    Den vre grnse i summen betyder at hjestegradsleddet i qn har en grad, der er detstrste ulige tal mindre end eller lig med n. S q10 er i virkeligheden et polynomiumaf grad 9 - faktisk er q10 = q9. Nogle af disse Taylorpolynomier er optegnet p fi-gur 13.3. Bemrk at man tilsyneladende kan f enddog meget gode approksimationerfrem med polynomier af forholdsvis lav grad.

  • 13.6. Weierstrass approksimationsstning 255

    Sammenligningen i eksempel 13.32 mellem Taylorpolynomierne og Bernsteinpoly-nomierne for sin 2x falder ubetinget ud til Taylorpolynomiernes fordel. Den pointegeneraliserer nu ikke srlig langt - fnomenet skyldes at sin x er s pn, som den er.Man ved at Taylorpolynomierne for sin x (med et vilkrligt udviklingspunkt) konver-gerer punktvist mod sin x, og at konvergensen er uniform p ethvert kompakt interval.Funktionerne behver ikke at vre ret grimme fr den slags falder fra hinanden: hvisvi havde forsgt at approksimere x 7 11+x2 over [1, 1], ville Taylorpolynomiernehave klaret sig ynkeligt - de divergerer i x = 1. Og gr man til de mere eksotiskefunktioner, f.eks. funktioner der er kontinuerte men intetsteds differentiable, s harman slet ikke nogen Taylorpolynomier at forsge sig med.

    Sammenligningen mellem de forskellige polynomiumsapproksimationer i eksem-pel 13.32 rejser sprgsmlet om hvordan man finder den bedste approksimation. Visger det nte grads polynomium der minimerer kriteriet

    p 7 supx[0,1]

    | f (x) p(x)| .

    Det er et uhyre vanskeligt problem, som der ikke findes gode algoritmer til at lse,medmindre man kan udnytte en eller anden speciel egenskab ved f . Hvad man tilgengld kan gre eksplicit, er at minimere kriteriet

    p 7 1

    0( f (x) p(x))2 dx

    over alle nte grads polynomier. Denne strrelse kaldes den kvadrerede L2-afstandmellem f og p. Sagen er at de kontinuerte funktioner p [0, 1], udstyret med detindre produkt

    f , g = 1

    0f (x) g(x) dx ,

    er et Hilbertrum - i hvert fald nsten, rummet er ikke fuldstndigt, men den po-inte lader vi ligge - og L2-afstanden mellem to funktioner er netop normafstandeni dette Hilbertrum. Man kan for hvert n finde et nte grad polynomium rn sdan atdisse polynomier udgr et ortonormalsystem. Man kan f.eks. starte med monomierne1, x, x2, . . . og lade dem gennemg en Gram-Schmidt ortonormaliseringsproces - dendvendige regninger er lidt biksede, men essentielt handler det om at lse nogle line-re ligningssystemer. Og det nte grads polynomium der har mindst mulig L2-afstandtil f , kan nu fs eksplicit frem som

    pn =n

    k=1

    f , rk rk .

  • 256 Kapitel 13. Deskriptiv teori: momenter

    Man taler om at oplse f efter en flge af ortogonale polynomier. Bemrk at sekven-sen r0, r1, . . . er udvalgt omhyggeligt ud fra det interval (in casu [0, 1]) vi prver atapproksimere p. Skulle vi approksimere over et andet interval, skulle vi have fat i etandet indre produkt, og dermed ville de frste rner ikke lngere vre ortogonale.

    Det er klart at L2-afstand og uniform afstand er beslgtede. I hvert fald glder der athvis den uniforme afstand er lille, s vil L2-afstanden ogs vre lille. Og som regelglder der ogs det modsatte. Men man kan lave eksempler hvor lille L2-afstand ikkefrer til lille uniform afstand. Det typiske eksempel er en funktion med en ekstremtspids top. Arealet under toppen kan vre meget lille, og derfor kan det mske ikkebetale sig i L2-forstand at approksimere funktionens opfrsel i toppen - de gode L2-approksimationer kan se helt bort fra toppen, og det koster selvflgelig i uniformafstand.

    Hvis man har en funktion f med mange meget spidse toppe, kan man komme ud forat den flge af polynomier, der fremkommer ved at oplse f efter ortogonale polyno-mier, ikke konvergerer punktvist mod f - og desmindre konvergerer uniformt. Fno-menet er temmelig degenereret - men det kan alts ske. Der er ikke nogen tvingendegrund til at tro at det nte grads polynomium, der minimerer L2-afstanden til f ogshar den allermindste uniforme afstand. Men sdvanligvis er det dog et kvalificeretbud.

    Teknikken bag Weierstrass approksimationsstning kan uden det store principiellebesvr overfres til flere dimensioner. Et polynomium i k variable er en endelig line-arkombination af monomier, alts af funktioner af typen

    (x1, . . . , xk) 7k

    i=1

    xmii

    hvor (m1, . . . ,mk) er ikke-negative hele tal.

    Stning 13.33 Lad f : [0, 1]k R vre kontinuert. Der findes en flge af reellepolynomier, (pn(x1, . . . , xk))nN, sdan at

    supx[0,1]k

    | f (x) pn(x)| 0 for n .

  • 13.6. Weierstrass approksimationsstning 257

    B: Vi njes med at se p tilfldet k = 2 for at de notationsmssige problemerikke skal eskalere. For hvert n N lader vi pn(x, y) vre Bernsteinpolynomiet

    pn(x, y) =n

    m,`=0

    f(

    mn,`

    n

    ) (

    nm

    )

    xm(1 x)nm(

    n`

    )

    y`(1 y)n`

    Lad > 0 vre givet. Idet f er uniformt kontinuert p [0, 1]2, findes et > 0, sdanat

    | f (z) f (z)| < for alle z, z [0, 1]2 , z z < .Her har vi brugt maksimumsnormen p R2 til at udpege en lille omegn for os.

    Lad os betragte et fast (x, y) [0, 1]2. Lad S n og Tn vre stokastiske variable, bino-mialfordelte med lngde n og successandsynlighed henholdsvis x og y. Vi ser analogtmed det etdimensionale tilflde at

    E f(S n

    n,

    Tnn

    )

    = pn(x, y) .

    Dermed er| f (x, y) pn(x, y)| =

    f (x, y) f(S n

    n,

    Tnn

    )

    dP. (13.22)

    Vi splitter integralet op i to, ved dels at integrere over(

    S nn x

    < ,

    Tnn y

    <

    )

    hvorp integranden er numerisk mindre end , og dels komplementrmngden, hvorintegranden hjst er 2 f . Idet sandsynligheden for komplementrmngden kan vur-deres ved

    P(

    S nn x

    eller

    Tnn y

    )

    P(

    S nn x

    )

    + P(

    Tnn y

    )

    fr vi ved at bruge Chebyshevs ulighed p begge sandsynligheder en vre grnsefor (13.22) p

    +2 f V(S n/n)

    2+

    2 f V(Tn/n)2

    + f n 2

    .

    Og det er mindre end 2, blot n er stor nok.

    Man kan let formulere versioner af Weierstrass approksimationsstning for andreterninger end [0, 1]k - tingene kan bikses p plads ved hjlp af affine transformationer.

  • 258 Kapitel 13. Deskriptiv teori: momenter

    Det er lidt mere speget at approksimere over andre kompakte mngder end terninger,men det kan godt lade sig gre. Lad i det flgende S 1 betegne enhedscirklen i R2,

    S 1 = {(x, y) R2 | x2 + y2 = 1} .

    Stning 13.34 Lad f : S 1 R vre en kontinuert funktion. Der findes da en flgeaf polynomier p1(x, y), p2(x, y), . . . p R2 s

    sup(x,y)S 1

    | f (x, y) pm(x, y)| 0 for m .

    B: Vi kan udvide f til en kontinuert funktion p hele R2 ved at stte

    f (x, y) = r f( x

    r,

    yr

    )

    hvor r =

    x2 + y2 for alle (x, y) , (0, 0) ,

    med den naturlige plombering f (0, 0) = 0. Vi bemrker at

    S 1 [1, 1] [1, 1] .

    Weierstrass approksimationsstning sikrer at der findes en flge af polynomier pmder approksimerer f uniformt p [1, 1] [1, 1]. Des mere m disse polynomierapproksimere f uniformt over den mindre mngde S 1. Men p S 1 er f jo blot f .

    Man kan faktisk f dette argument til at fungere for enhver kompakt mngde K Rn,for en klassisk abstrakt stning, kendt som Tietzes udvidelsesstning, sikrer at en-hver kontinuert reel funktion, defineret p en kompakt delmngde af Rn, kan udvidestil en kontinuert funktion defineret p hele Rn. For de kompakte mngder man vilinteressere sig for i praksis, er det dog sjldent noget problem at foretage den nd-vendige udvidelse ved hndkraft. Vi fr i afsnit 17.7 brug for at kunne approksimerekontinuerte funktioner, defineret p

    S 1 . . . S 1

    n kopier R2n ,

    uniformt med polynomier. For sdanne funktioner kan udvidelsen forlbe analogtmed hvad der sker i beviset for stning 13.34.

  • 13.7. Sandsynlighedsml givet ved momenter 259

    13.7 Sandsynlighedsml givet ved momenter

    En fordeling er til en vis grad karakteriseret ved sine momenter. Der findes ikke nogengod algoritme til at rekonstruere fordelingen ud fra momenterne, men alligevel kanman ofte sige at hvis man kender alle momenter, s kender man ogs fordelingen.Forbindelsen mellem momenter (der jo er integraler af monomier) og ml af kon-krete mngder (der jo er integraler af indikatorfunktioner) knyttes via kontinuerte,begrnsede funktioner.

    Lad Cb(R) betegne systemet af kontinuerte, begrnsede reelle funktioner defineret pR. Det er klart at Cb(R)-funktioner er Borelmlelige, og de er integrable med hensyntil et vilkrligt sandsynlighedsml p R.

    En speciel type Cb(R)-funktioner, der spiller en stor rolle i integrationssammenhng,er de skaldte bumpfunktioner. Det er funktioner, der kun antager vrdier i [0, 1].Som regel bruges ordet kun hvis funktionens vrdier er 0 eller 1 p store omrder -det bump der er tale om, er det omrde hvor funktionen rejser sig fra at vre 0 til atvre 1, se figur 13.4. Man tnker p en bumpfunktion som en slags kontinuert fttertil en indikatorfunktion.

    Hvis K er en kompakt mngde indeholdt i en ben mngde V , og hvis f er enbumpfunktion der opfylder at

    f (x) = 1 for alle x K , f (x) = 0 for alle x V c ,

    s skriver man gerne at K f V . Hvis [a, b] (c, d) kan vi f.eks. konstruere enstykkevis affin bumpfunktion f der opfylder at [a, b] f (c, d) ved den eksplicittefunktionsforskrift

    f (x) =

    0 for x cx ca c for x [c, a]

    1 for x [a, b]x db d for x [b, d]

    0 for x d .

    (13.23)

    En stykkevis affin bumpfunktion af denne type er illustreret i figur 13.4.

  • 260 Kapitel 13. Deskriptiv teori: momenter

    PSfrag replacements

    a bc d

    1

    0

    Figur 13.4: Grafen for den stykkevist affine bumpfunktion givet ved (13.23). Bumpfunktio-nen er konstrueret s den er 0 uden for (c, d) og konstant 1 p det lidt mindre interval [a, b].

    Stning 13.35 Lad og vre to sandsynlighedsml p (R,B). Hvis

    f (x) d(x) =

    f (x) d(x) for alle f Cb(R) , (13.24)

    s er = .

    B: Lad (a, b) vre et givet begrnset bent interval. For hvert n > 2/(b a)vlges en bumpfunktion fn, der opfylder at

    [

    a +1n, b 1

    n

    ]

    fn (a, b)

    Man kan f.eks. bruge de stykkevist affine bumpfunktioner fra (13.23), men det pr-cise valg spiller i virkeligheden ingen rolle. Under alle omstndigheder glder derat fn 1(a,b), majoriseret af konstanten 1. S majorantstningen giver at

    fn(x) d(x)

    1(a,b)(x) d(x) = (

    (a, b))

    for n .

    Samme type grnseresultat glder naturligvis for -integraler, og da fn-funktionernealle er kontinuerte og begrnsede, ser vi at

    (

    (a, b))

    = limn

    fn(x) d(x) = limn

    fn(x) d(x) = (

    (a, b))

    .

    Eftersom de begrnsede bne intervaller udgr et fllesmngdestabilt frembringer-system for Borelalgebraen p R, flger det af entydighedsstningen for sandsynlig-hedsml at = .

  • 13.7. Sandsynlighedsml givet ved momenter 261

    Stning 13.36 Lad og vre to sandsynlighedsml p (R,B), og lad I vre etbegrnset interval. Hvis

    (I) = (I) = 1,

    og hvis

    xk d(x) =

    xk d(x) for alle k N . (13.25)

    s er = .

    B: Antagelsen om at lgger hele sin sandsynlighedsmasse i intervallet I,gr at alle -integraler over R uden videre kan erstattes af -integraler over I. DaI er begrnset, er |x|k begrnset p I, og der er sledes ingen problemer med ommomenterne eksisterer.

    B: Hvis p(x) =n

    k=0 ak xk er et polynomium, ser vi at p er integrabel med hensyn

    til svel som , og det flger af (13.25) at

    p(x) d(x) =n

    k=0

    ak

    xk d(x) =n

    k=0

    ak

    xk d(x) =

    p(x) d(x) (13.26)

    Betragt en vilkrlig funktion f Cb(R). Vlg et > 0. Iflge Weierstrass approksi-mationsstning findes et polynomium p(x), s

    | f (x) p(x)| for alle x I

    Vi ser at

    f (x) d(x)

    p(x) d(x)

    I| f (x) p(x)| d(x) .

    En tilsvarende vurdering glder naturligvis for -integralerne, og kombineres de tovurderinger med (13.26), fr vi at

    f (x) d(x)

    f (x) d(x) 2 .

    Argumentet kan gennemfres for alle > 0, og derfor slutter vi at

    f (x) d(x) =

    f (x) d(x).

    Men f var en vilkrlig Cb(R)-funktion, og det flger derfor af stning 13.35 at = .

  • 262 Kapitel 13. Deskriptiv teori: momenter

    Forudstningen om at de to sandsynlighedsml giver fuld sandsynlighed til et be-grnset interval er ndvendig: der kendes eksempler p overtlleligt mange forskel-lige sandsynlighedsml p den positive halvakse, der alle har samme momenter, seopgave 13.8.

    13.8 Noter

    Et godt sted at lede efter momenter, er i de encyklopdiske fordelingsgennemgangeJohnson et al. (1992)og Johnson et al. (1994). Integraler, der ikke findes i disse vr-ker, vil man som regel kunne sl op i Abramowitz og Stegun (1992). En mere tids-svarende form for opslag er at bruge en computerpakke til symbolsk matematik: bdeMathematica og Maple har implementeret store dele af integraletabellerne fra Abra-mowitz og Stegun (1992).

    Inden for den teoretiske statistik, stder man ofte p de skaldte kumulanter for enfordeling. Det er specielle funktioner af momenterne, se Severini (2000).

    13.9 Opgaver

    O 13.1. Lad X vre ligefordelt p mngden {1, . . . , n}. Find middelvrdi ogvarians for X.

    O 13.2. Lad den stokastiske variabel X have tthed givet ved (n N)

    f (x) =n 1

    (1 + x)n, x 0.

    Find de k for hvilke X har kte moment og beregn EX og VX.

    O 13.3. Lad den stokastiske variabel X have tthed

    f (x) = 2x, x (0, 1).

    St Y = X3 og find EX, EY og E(XY).

    O 13.4. Lad X vre en reel stokastisk variabel, ligefordelt p (0, 1), og ladY = 2 log X. Find EY . Find endvidere ttheden for Y , og kontroller ved hjlp afden fundne tthed din udregning af EY .

  • 13.9. Opgaver 263

    O 13.5. Lad den stokastiske variabel X have en fordeling med tthed

    f (x) = 2xex2, x > 0.

    Find fordelingen af Y = X2 og EYn, n N.

    O 13.6. Eftervis at skvhed og kurtosis for normalfordelingen vitterligt er nul.

    O 13.7. Vis at det tredie og fjerde centrale moment for -fordelingen med form-parameter er 2 hhv. 32 + 6. Find skvhed og kurtosis.

    O 13.8. Lad f0(x) vre ttheden for den logaritmiske normalfordeling medparametre (0, 1), dvs.

    f0(x) =1

    2x1 e(log x)

    2/2, x > 0.

    S 13.8(a). Vis at

    0f0(x) sin(2 log x) dx = 0.

    S 13.8(b). Gr rede for at

    fa(x) = f0(x)(1 + a sin(2 log x)

    ), x > 0, (13.27)

    er en sandsynlighedstthed for a [1, 1].

    S 13.8(c). Vis at

    0xk f0(x) sin(2 log x) dx = 0 for k = 1, 2, . . . .

    S 13.8(d). Vis at alle sandsynlighedsml med tthed af formen (13.27), her-under den logaritmiske normalfordeling, har samme momenter.