12
СТАТИСТИЧНИЙ ДИСПЕРСІЙНИЙ АНАЛІЗ Планування експерименту Тернопільський національний технічний університет Можна Олена Олегівна © 2013

Дисперсійний аналіз

Embed Size (px)

DESCRIPTION

Дисперсійний аналіз (Можна Олена)

Citation preview

Page 1: Дисперсійний аналіз

СТАТИСТИЧНИЙ ДИСПЕРСІЙНИЙ

АНАЛІЗ

Планування експерименту

Тернопільський національний технічний університет

©Можна Олена Олегівна 2013

Page 2: Дисперсійний аналіз

2

Статистичний дисперсійний аналіз

Статистичний дисперсійний аналіз – один з методів виявлення впливу окремих факторів на показник біологічного або технологічного процесу.

Дисперсійний аналіз був створений спочатку для статистичної обробки агрономічних дослідів. В наш час його також використовують в економічних, технічних та соціальних експериментах.

В будь-якому експерименті середні значення досліджуваних величин змінюються у зв’язку зі зміною основних факторів (кількісних та якісних), що визначають умови досліду, а також і випадкових факторів. Дослідження впливу тих чи інших факторів на мінливість середніх є задачею дисперсійного аналізу.

В основі дисперсійного аналізу є такий принцип: якщо на випадкову величину діють взаємно незалежні фактори A, B, …, то загальна дисперсія дорівнює сумі дисперсій, зумовлених дією окремо кожного з факторів:

Page 3: Дисперсійний аналіз

3

Однофакторний дисперсійний аналіз Розглядається дія одиничного фактору А, котрий приймає k різних значень (рівнів

фактора). Найпростіші розрахунки виходять при рівній кількості дослідів на кожному рівні фактора А.

Дисперсійний аналіз можна провести за наступним алгоритмом:

Обчислюється:

Сума за стовпцями:

Сума квадратів усіх дослідів:

Суму квадратів сум за стовпцями, поділену на число дослідів в стовпці:

Квадрат загальної суми, поділений на число всіх дослідів (коректуючий член):

Суму квадратів для стовпчика:

Загальна сума квадратів , рівна різниці між сумою квадратів всіх дослідів та коректуючим членом:

Залишкову суму квадратів для оцінки помилки експерименту:

дисперсію:

дисперсію:

Page 4: Дисперсійний аналіз

4

Результати розрахунків однофакторного дисперсійного аналізу

Результати розрахунків представити у вигляді таблиці дисперсного аналізу:

Якщо то вплив фактора А слід вважати незначним. При

цьому загальна дисперсія пов’язана тільки з фактором випадковості і

може служити оцінкою для дисперсії відтворення. Така оцінка краща від

, бо має більше число степенів вільності. Якщо ж справедлива

нерівність де f1=k-1 та f2=k(n-1)=N-k різниця

між дисперсіями та значна і, відповідно, значний вплив фактора

А.

Page 5: Дисперсійний аналіз

5

Двофакторний дисперсійний аналіз Вивчаючи вплив на процес одночасно двох факторів А та В. Фактор А вивчається

на рівнях а1, а,…,аk, фактор В – на рівнях b1, b2,…, bm. При проведенні двофакторного дисперсійного аналізу зручно використовувати наступний алгоритм розрахунку. Знаходимо:Суми по стовпцях Суми по стрічках Суму квадратів всіх дослідів ;Суму квадратів сум по стовпцях, поділену на число дослідів в стовпцю ; Суму квадратів сум по стрічках, поділену на число дослідів в стрічці ; Квадрат загальної суми, поділений на число всіх дослідів

(коректуючий член) ;Суму квадратів для стовпця SSA=SS2-SS4

Суму квадратів для стрічки SSB=SS3-SS4

Загальну суму квадратів, рівну різниці між сумою квадратів всіх дослідів та коректуючим членом SSзаг.=SS1-SS4;

Залишкову суму квадратів SSзал.=SSзаг.-SSA-SSB=SS1-SS2-SS3+SS4;

Дисперсію ;Дисперсію ;Дисперсію .

Page 6: Дисперсійний аналіз

6

Результати розрахунків двофакторного дисперсійного аналізу

Результати розрахунків представляють у вигляді таблиці дисперсного аналізу:

Така модель справедлива, коли між факторами А та В немає взаємодії. В протилежному випадку цій взаємодії як фактору присутня своя дисперсія s2

АВ. Дисперсія взаємодії АВ, s2АВ є мірою того, наскільки

вплив фактора А залежить від рівня фактора В, та навпаки, наскільки вплив фактора В залежить від рівня А. В наведено вище алгоритмі при наявності взаємодії між факторами s2

АВ, як складова частина, входить в

дисперсію s2пом.

Page 7: Дисперсійний аналіз

7

Приклад розрахунку двофакторного дисперсійного аналізу

Розрахуємо двофакторний дисперсійний аналіз для того, щоб дослідити вплив фактора А (розтягування еспандер), та вплив фактора В (присідання) одночасно на частоту пульсу. Для його проведення в якості досліджуваних даних використаємо дані з наступної таблиці.

Для перевірки значимості впливу фактора А на параметр порівнюємо обчислене значення статистики FA=46.3365 з табличним значенням F0.95(3.80)=2.76:

FA>F0.95(3.80)

Робимо висновок що фактор А впливає на параметр, що досліджується.

Для визначення степені впливу фактора В на параметр порівнюємо обчислене значення статистики FB=1391.0256 табличним значенням F0.95(4.80)=2.53:

FB>F0.95(4.80)

Робимо висновок що фактор В теж впливає на параметр, що досліджується, проте, порівнюючи різниці між статистикою та табличним значенням критерію Фішера при дослідженні факторів А і В, можемо з впевненістю стверджувати, що вплив фактора В (присідання) набагато суттєвіший.

Для перевірки наявності взаємодії між факторами А і В порівняємо обраховане значення статистики FAB=3.2286 з табличним значенням F0.95(12.80)=1.92:

FAB>F0.95(12.80)

З отриманих результатів можна зробити висновок про слабку взаємодію двох факторів.

Page 8: Дисперсійний аналіз

8

Досліджувані дані для розрахунку двофакторного дисперсійного аналізу

Фактор В

Фактор А

Рівні фактора В (присідання)

0 10 20 30 40

Пульс В.м. Н.м Пульс В.м Н.м Пульс В.м Н.м Пульс В.м Н.м Пульс В.м Н.м

Рівні фактора А

(Легке розтягуванн

я еспандера)

0 1 70 100 50 98 110 60 118 110 60 142 115 50 154 120 45

2 78 90 55 102 110 65 118 110 60 134 115 45 150 120 50

3 67 100 65 100 115 65 112 105 60 142 115 50 156 125 45

4 74 95 50 96 110 65 120 115 55 140 110 55 152 120 50

5 72 100 55 104 115 70 116 110 60 134 115 55 154 125 45

10 1 75 100 70 103 105 60 134 115 55 144 120 50 159 125 40

2 89 100 70 107 105 60 125 120 55 143 125 45 154 145 40

3 85 95 60 105 110 60 132 115 55 140 120 50 150 157 35

4 77 105 65 103 105 65 128 115 60 147 120 50 152 125 45

5 75 100 60 103 110 55 129 110 60 148 115 50 160 135 40

20 1 75 100 60 100 110 55 130 115 55 152 120 45 161 155 45

2 79 105 65 108 115 50 132 120 60 150 120 45 156 150 45

3 90 110 75 106 115 50 132 120 50 150 125 40 160 150 40

4 86 100 70 98 110 60 120 115 55 148 120 45 157 145 45

5 81 105 65 100 110 50 120 115 50 152 125 45 161 150 40

30 1 87 105 65 105 115 60 134 125 55 152 125 35 157 160 35

2 92 110 60 107 120 55 126 130 40 154 130 35 160 155 40

3 89 105 60 103 120 55 136 125 45 151 130 35 160 155 40

4 94 115 75 105 115 50 132 125 50 150 130 40 161 155 35

5 95 120 70 109 115 50 134 130 40 154 130 35 160 155 35

Page 9: Дисперсійний аналіз

9

Результати розрахунківСереднє значення спостережень одної комірки

X(1,1,*)=72.20 X(2,3,*)=129.80 X(3,5,*)=159.00X(1,2,*)=100.00 X(2,4,*)=144.40 X(4,1,*)=91.40X(1,3,*)=116.80 X(2,5,*)=156.40 X(4,2,*)=105.80X(1,4,*)=138.40 X(3,1,*)=81.80 X(4,3,*)=132.00 X(1,4,*)=153.20 X(3,2,*)=102.40 X(4,4,* )=152.00 X(2,1,*)=79.40 X(3,3,*)=129.60 X(4,5,*)= 59.60 X(2,2,*)=104.20 X(3,4,*)=150.40

Середнє значення всієї сукупності спостережень Х=122.97Середні значення по стрічці:

X(1,*,*)=116.12 X(3,*,*)=124.64X(2,*,*)=122.92 X(4,*,*)=128.20

Середні значення по стовпчику:Х(*,1,*)= 81.30Х(*,2,*)= 103.10Х(*,3,*)= 127.05Х(*,4,*)= 146.35Х(*,5,*)= 157.05

Оцінка внутрішньої дисперсії по фактору А: S1^2=642.2233Оцінка внутрішньої дисперсії по фактору В: S2^2=19279.6150Оцінка між групової дисперсії: S3^2=44.7483Оцінка залишкової дисперсії: S4^2=13.86Обчислене значення статистики:Fa=46.3365Обчислене значення статистики:Fb=1391.0256Обчислене значення статистики:Fab=3.2286

Page 10: Дисперсійний аналіз

10

Латинські квадрати

При проведенні експерименту число дослідів можна значно скоротити, якщо скористатись двофакторним експериментом по схемі латинського квадрату, використаного вперше Фішером. Латинський квадрат n x n – це квадратна таблиця, складена з n елементів (чисел чи букв) таким чином, що кожний елемент повторюється в кожній стрічці і кожному стовпчику тільки один раз.

Page 11: Дисперсійний аналіз

11

- Греко латинські квадрати

Планування за латинським квадратом дозволяє ввести в дослідження три фактора. Для чотирьох факторів хороші властивості має план експерименту по схемі греко-латинського квадрату. Число рівнів для всіх факторів повинно бути однакове.

Page 12: Дисперсійний аналіз

12

Перелік використаних джерел

1. Вікіпедія [Електронний ресурс] Метематична статистика – Режим доступу: URL: http://uk.wikipedia.org/wiki/Диспрсійний_аналіз - Загол. з екрану;

2. ТНТУ Wiki [Електронний ресурс] Дисперсійний аналіз – Режим доступу: URL: http://wiki.tntu.edu.ua/Дисперсійний_аналіз - Загол. з екрану;

3. Дисперсійний аналіз [Електронний ресурс] Двофакторний дисперсійний аналіз – Режим доступу: URL: http://old.lp.edu.ua/fileadmin/ICCT/top/pub/Chaykivskyy/lek/da/da03.html - Загол. з екрану;

4. Дисперсійний аналіз [Електронний ресурс] Латинські і греко-латинські квадрати - Режим доступу: URL: http://old.lp.edu.ua/fileadmin/ICCT/top/pub/Chaykivskyy/mm/da.pdf.