27
Выборочный метод Опр .: Статистической совокупностью называют множество однородных предметов или явлений. Опр.: Число n элементов этого множества называется объёмом совокупности. Опр. : Наблюдаемые значения x i признака X называют вариантами. Варианты расположенные в возрастающей последовательности называются дискретным вариационным рядом. Опр .: Под частотой m значения признака понимают число членов совокупности с данной вариантой. Опр. : Отношения частоты к объёму статистической совокупности называют относительной частотой значения признака. W= Опр .: Соответствие между вариантами вариационного ряда и их частотами (или относительными частотами) называют статистическим распределением выборки. x i X 1 X 2 X 3 x k n i N 1 N 2 N 3 n k Опр.: Средним выборочным называют величину B = (2) Опр .: Дисперсией признака X по отношению к его среднему арифметическому называют величину D B (x)= (3) Опр.: Квадратный корень из дисперсии называют средним квадратичным отклонением G(x)= распределения относительных частот.

Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

  • Upload
    others

  • View
    23

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

Выборочный методОпр.: Статистической совокупностью называют множество однородных предметов или явлений.Опр.: Число n элементов этого множества называется объёмом совокупности.Опр.: Наблюдаемые значения xi признака X называют вариантами. Варианты расположенные в возрастающей последовательности называются дискретным вариационным рядом.Опр.: Под частотой m значения признака понимают число членов совокупности с данной вариантой.Опр.: Отношения частоты к объёму статистической совокупности называют относительной частотой значения признака.

W=

Опр.: Соответствие между вариантами вариационного ряда и их частотами (или относительными частотами) называют статистическим распределением выборки.

xi X1 X2 X3 xk

ni N1 N2 N3 nk

Опр.: Средним выборочным называют величину

B = (2)

Опр.: Дисперсией признака X по отношению к его среднему

арифметическому называют величину DB (x)= (3)

Опр.: Квадратный корень из дисперсии называют средним квадратичным отклонением G(x)= распределения относительных частот.Опр.: Эмпирической функцией распределения называют функцию определяющую для каждого значения относительную частоту событий (X<x),

т.е. F*(x)=w(X<x)= , где -число вариант меньших x , а -объём выборки

Опр.: Полигоном частот называют ломаную, отрезки, которой соединяют точки (x1,n1),(x2,n2),(xk,nk)Опр.: Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых являются частичные интервалы

длинной li ,а высотой

Page 2: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

Пример выполнения лабораторной работы №1“ Первичная обработка данных“

Цель работы: Овладеть методом вычисления ,составление эмпирической функции распределения и гистограммы частот.Задание: По данной выборке составить статистическое распределение, вычислить , составить эмпирическую функциюxi 17 18 19 20 21 22 23ni 7 7 3 1 3 2 2

1. Тогда ряд распределения относительных частот имеет видXi 17 18 19 20 21 22 23

W=0,28 0,28 0,12 0,04 0,12 0,08 0,08

2. Вычислить среднюю выборочную :

3. Дисперсия признака X равна DB (x)=

5.Тогда среднее квадратическое отклонение

6.Составим функцию распределения а)x1=17-наименьшая варианта значит F* (x3)=0 при x б) x2=18 , значение x18 , именно x1=17 наблюдалось 7 раз

F*(x)= при 17x 18

в) x3=19 значение x19 ,а именно x2=18 и x1=17 встречались 14 раз т.е.

F*(x)= при 18x 19

Аналогично F*(x)= при 14x 20

Page 3: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

F*(x)= при 20x 21

F*(x)= при 21x 22

F*(x)= при 22x 23

Так как x=23 –наибольшая варианта, то F*(x)=1 при x23 Функция распределения имеет вид

F*(x)=

График функции распределения F*(x)

F*(x)

1 0,96 0,84 0,72 0,68 0,56 0,28 17 18 19 20 21 22 23 X 7)Построим полигон частот по точкам (17,7) ; (18;7) ; (19;3) ; (20; 1) ; (21;3); (22;2) ; (23;2) ni

7,5

Page 4: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

17 18 19 20 21 22 23 xi

8)Построить гистограмму частотДля этого разобьем вариантный ряд на интервалы равной длины h , в нашем случае h=2Составим таблицу

17-19 19-21 21-23

ni 15 4 6

7,5

3 3 2

n 17 19 21 23

Пример выполнения лабораторной работы №2 “Метод произведений для вычислений ”

Цель работы: Овладеть методом вычисления и в случае распределения равностоящих вариант.Задание: По данной выборке вычислить , xi 12 14 16 18 20 22ni 5 15 50 16 10 4

Составить статистическое распределение.

Page 5: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

xi 12 14 16 18 20 22ni 5 15 50 16 10 4

Данное распределение равностоящих вариант и соответствующих им частот.Для вычисления воспользуемся методом произведений.Составим расчётную таблицу 1) запишем варианты в первый столбец2) запишем частоты во второй столбец , сумму частот (100) поместим в

нижнюю клетку столбца ;3) В качестве ложного нуля C выберем варианту, которая принадлежит

строке, содержащей ложный нуль, пишем 0;над нулем последовательно запишем -1, -2; под нулём 1, 2, 3;

4) В четвёртой столбец записываем произведение частот ni на условные варианты ui , сумму произведений

5) Произведение частот на квадраты условных вариант , т.е. запишем

в пятый столбец. Сумму чисел (127) записываем в нижнюю клетку столбца.

Произведения частот на квадраты условных вариант , увеличенных на единицу , т.е. , запишем в шестой контрольный столбец ; сумму чисел столбца (273) помещаем в нижнюю клетку шестого столбца.

Таблица заполнена.Для контроля вычисления пользуются тождеством:

Контроль:

xi ni ui uini niui2 ni(ui+1)2

12 5 -2 -10 20 514 15 -1 -15 15 -16 50 0 -25 - 5018 16 1 16 16 6420 10 2 20 40 9022 4 3 12 36 64

n=100 23=

Для вычисления и воспользуемся формулами

Page 6: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

= h –шаг (разность между двумя соседними вариантами) C-ложный ноль

- условный момент I порядка

- условный момент II порядка

С=16

Найдём h, h=14-12=2

Вычислим и

= =0,23

Статистические оценки параметров распределения

Опр. Интервальной называют оценку, которая определяется двумя числами- концами интервала, покрывающего оцениваемый параметр.Опр. Доверительным называют интервал, который с заданной надёжностью покрывает оцениваемый параметр. Для оценки математического ожидания а нормально распределённого количественного признака X по выборочной средней при известном среднем квадратическим отклонении генеральной совокупности служит доверительный интервал.

Page 7: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

где - точность оценки; n-объём выборки; t- такое значение аргумента

функции Лапласа Ф(t), при котором Ф(t)= .

При неизвестном (и объёме выборки n>30).

исправленное среднее квадратическое отклонение, находят

по таблице Стьюдента по заданным и . Для оценки среднего квадратического отклонения нормально распределённого количественного признака X с надёжностью по исправленному отклонению S служат доверительные интервалы.

(при g<1) (при g>1)

где g находят по таблице по заданным n и .

Пример выполнения лабораторной работы №3“Доверительные интервалы”

Цель работы :Овладение методом составления доверительных интервалов для оценки математического ожидания при незвестном и для оценки среднего квадратического отклонения нормального распределения.

Порядок выполнения лабораторной работы.

1. Составьте статистическое распределение частот результатов испытаний.

xi -2 1 2 3 4 5

ni 2 1 2 2 2 1

Page 8: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

2. Вычислить

n=103. Вычислить исправленное среднее квадратическое отклонение S по

формуле

S=24

4. Найти по таблице Стьюдента по заданным и , .Найдём искомый доверительный интервал покрывающий неизвестное математическое ожидание а с надёжностью .

Подставляя =2, , S=2,4 , Получим 5. Найти g по таблице по заданным и n=10.

6. Найти доверительный интервал для , т.к. g<1 то доверительный интервал имет вид

Подставляя S=2,4 ,g=0,65 получим 0,84

Элементы теории корреляции.Корреляционной зависимостью Y от X называют функциональную зависимость условной средней от X.

представляет уравнение регрессии Y на X.

представляет уравнение регрессии X на Y. Если обе линии регрессии- прямые, то корреляцию называют линейной. Выборочное уравнение прямой линии регрессии Y на X имеет вид:

где - условная средняя, и - выборочные средние признаков X и Y, и - выборочные средние квадратические отклонения; выборочный коэффициент корреляции, причём

Page 9: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

Если данные наблюдений над признаками X и Y заданы в виде корреляционной таблицы с равностоящими вариантами, то целесообразно перейти к условным вариантам.

где С1 – “ложный нуль ” варианты X, где С2 – “ложный нуль” варианты Y,h1- шаг варианты X, h2- шаг варианты Y.В этом случае

Для вычисления удобно использовать метод четырёх полей.В случае не группированных данных наблюдений над признаками X и Yуравнение линии регрессии удобнее записать в виде:

где - выборочный коэффициент регрессии Y на X.

Лабораторная работа №4По заданной выборке получить уравнение линии регрессии Y на X.Цель работы: получить уравнение прямой линии регрессии по несгруппированным данным.

Порядок выполнения работы:Заполним вспомогательную таблицу:xi yi Xi

2 xiyi

2 1,25 4 2,52,5 1,4 6,25 3,55 1,5 25 7,56,5 1,75 42,25 11,3757 2,25 49 15,75

Page 10: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

а) в первый столбец запишем варианты xi; в нижнюю клетку б) во второй столбец запишем варианты yi; в нижней клетке столбца поместим в) в третий столбец запишем квадраты вариант xi-xi

2. В нижней клетке

столбца поместим .

г) в четвёртый столбец запишем произведения вариант . В нижней

клетке столбца поместим . По формулам

и

вычислим искомые коэффициенты уравнения прямой линии регрессии.

Уравнение прямой лини регрессии имеет вид :

Лабораторная работа №5. “Метод четырёх полей”.Задание: Найти выборочное уравнение прямой линии регрессии Y на X по данным, приведённым в корреляционной таблице используя метод 4-х полей.

20 25 30 35 40 ny

16 4 6 - - - 1026 - 8 10 - - 1836 - - 32 3 9 4446 - - 4 12 6 2256 - - - 1 5 6nx 4 14 46 16 20 n=100 Цель работы: Овладеть методом вычисления коэффициентов прямой линии регрессии по данным корреляционной таблицы.

Порядок выполнения работы.

Page 11: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

Составим корреляционную таблицу в условных вариантах, выбрав в качестве C1=30 и C2=36, h1=5 и h2=10.

-2 -1 0 1 2 nv

-2 4 6 - - - 10-1 - 8 10 - - 180 - - 32 3 9 441 - - 4 12 6 222 - - - 1 5 6nu 4 14 46 16 28 n=100Найдём и

Найдём вспомогательные величины и

Найдём

Для вычисления воспользуемся методом четырёх полей.-2 -1 0 1 2 I II

-2 4 6 - - 0

-1 0 1 - - 0

Page 12: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

0 III IV1 - - 12 6 0 242 - - 1 5 0 21I II 0 0 36 0

III 0 0 IV 13 32 0 45

Описание заполнения таблицы.1.Найти сумму произведений и по строкам первого поля

и поместим их в дополнительный столбец 2.Найти сумму произведений и по столбцам первого поля

и и поместим их в дополнительную строку 3.Найти сумму чисел дополнительного столбца (28+8=36) и запишем её в первую итоговую клетку Для контроля сложим все числа дополнительной строки (16+20=36) .Аналогично ведётся расчёт и по остальным полям.

Вычислим по формуле

=

Найдём и , , по формулам

Составим уравнение прямой линии регрессии

Окончательно имеем

Page 13: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

Статистическая проверка статистических гипотиз. Пусть эмпирическое распределение задано в виде последовательности равностоящих вариант и соответствующих им частот.

xi x1 x2 xN

ni n1 n2 nN

Требуется, используя критерий Пирсона, проверить гипотезу о том, что генералтная совокупность распределена нормально.Правило 1.Вычислить и

2.Вычислить теоретические частоты

n-объём выборки, h-шаг, ui=

3.Сравнить эмпирические и теоретические частоты с помощью Критерия Пирсона. Для этого а) составляют расчётную таблицу, по которой находят

наблюдаемое значение критерия

б) По таблице критических точек распределения x2 по заданному уровню значимости и числу степеней свободы k=S-3 ( S-число групп выборки ) правосторонней критической области.Если < -нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.Если < - гипотезу отвергают.

Page 14: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

Пример выполнения лабораторной работы №6“Критерий согласия Пирсона .”

Цель работы: Овладеть критерием Пирсона. Задание: Используя критерий Пирсона, при уровне значимости , проверить, согласуется ли, гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объёма n=200.xi 5 7 9 1 13 15 17 19 21ni 15 26 25 30 26 21 24 20 13

Порядок выполнения работы:Найдём и

Вычислим теоретические частоты, учитывая , что n=200, h=2 , по формуле

Составим расчётную таблицу

Page 15: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

i xi

1 5 -1,62 0,1074 9,12 7 -1,20 0,1942 16,53 9 -0,77 0,2966 25,34 11 -0,35 0,3752 32,05 13 0,08 0,3977 33,96 15 0,51 0,3503 29,87 17 0,93 0,2589 22,08 19 1,36 0,1582 13,59 21 1,78 0,0818 7,0Сравним эмпирические и теоретические частоты а) Составим расчётную таблицу, из которой найдём наблюдаемое значение

критерия

1 15 9,1 5,9 34,81 3,82 26 16,5 9,5 90,25 3,63 25 25,3 -0,3 0,09 0,04 30 32 -2,0 4,00 0,15 26 33,9 -7,9 62,41 1,96 21 29,8 -8,8 77,44 2,37 24 22,0 2,0 4,0 0,28 20 13,5 6,5 42,25 3,09 13 7 6,0 36,00 5,1

200 X2наб=20

X2наб=3,8+3,6+0,0+0,1+1,9+2,3+0,2+3,0+5,1=20

По таблице критических точек распределения X2 по уровню значимости и числу степеней свободы находим

критическую точку правосторонней критической области

Так как < - гипотезу о нормальном распределении генеральной совокупности X отвергаем. Другими словами, эмпирические и теоретические частоты различаются значимо.

Page 16: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

Однофакторный дисперсионный анализ.Пусть на количественный нормально распределённый признак X воздействует фактор F, который имеет p постоянных уровнейF1, F2 F3 Fp. На каждом уровне произведено по q испытаний.Результаты наблюдений - числа xij =где i– номер испытания (i=1,2,,q), j-номер фактора (j=1,2,,p), записывают в виде таблицы:Номер испытания Уровни фактора

i F1 F2 Fp

1 x11 X1 Xp

2 X21 X22 X2p

q xq1 Xq2 Xqp

Групповая средяя

Ставится задача: на уровне значимости проверить нулевую гипотезу о равенстве групповых средних при допущении, что групповые генеральные дисперсии хотя и неизвестны, но одинаковы. Для этой задачи вводится общая сумма квадратов отклонений наблюдаемых значений признака от общей средней.

Факторная сумма квадратов отклонений групповых средних от общей средней (характеризует рассеяние между “группами”)

Page 17: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

Остаточная сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней (характеризует рассеяние “внутри группы”)

Практически остаточную сумму находят по формуле:Sост=Sобщ-Sфакт

Для вычисления общей и факторной сумм более удобны следующие

формулы:

где – сумма квадратов наблюдаемых значений признака на уровне

Fj -сумма наблюдаемых значений признака на уровне Fj.

Если наблюдаемые значения признака сравнительно больше числа, то для упрощения вычислений вычитают из каждого наблюдаемого значения одно и то же число C, примерно равное общей средней. Если уменьшенные значения

, то

где – сумма квадратов уменьшенных значений признака на

уровне Fj; - сумма уменьшенных значений признака на уровне Fj.

Разделив уже вычисленные факторную и остаточную сумм на соответствующее число степеней свободы, находят факторную и остаточную дисперсии.

,

Page 18: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

Сравниваем факторную и остаточную дисперсии по критерию Фишера – Снедекора. Если различие групповых средних незначимоеЕсли различие групповых средних значимое.

Пример выполнения лабораторной работы №7Цель работы: Овладеть методами однофакторного анализа для одинакового числа испытаний на всех уровнях. Задание: Произведено по 4 испытания на каждом из трёх уровней фактора F .Методом дисперсионного анализа, при уровне значимости 0,05 , проверить нулевую гипотезу о равенстве групповых средних. Предполагается, что выборки извлечены из нормальных совокупностей с одинаковыми дисперсиями.Результаты испытаний приведены в таблице.Номер испытания Уровни фактораI F1 F2 F3

1 38 20 212 36 24 223 35 26 314 31 30 34

35 25 27

Прядок выполнения работы.

1.Общая средняя

2.Для упрощения расчёта перейдём к уменьшенным величинамy11=38-29=9 , y21=36-29=7 и т.д.Составим расчётную таблицуНомер испытания Уровни фактора Итоговый столбец

F1 F2 F3

Page 19: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных

I yi1 yi12 yi2 yi2

2 yi3 yi32

1234

9762

8149364

-9-5-31

812591

-8-725

6449425

Sj=yij2 170 116 142 Sj=428

Tj=yij 24 -16 -8 Tj=0Tj

2 576 256 64 Tj2=896

=

Найдём остаточную сумму квадратов отклонений Sост=Sобщ-Sфакт=428-224=204Найдём факторную дисперсию; для этого разделим Sфакт на число степеней свободы p-1=3-1=2

Найдём остаточную дисперсию, для этого разделим Sост на число степеней свободы p(q-1)=3(4-1)=9

=

Сравним факторную и остаточную дисперсии с помощью критерия Фишера- Снедекора.

Найдём наблюдаемое значение критерия Fнабл=

Учитывая, что число степеней свободы числителя k1=2, а знаменателя k2=9 и что уровень значимости по таблице (см. приложение) находим критическую точку Fкр(0,05;2;9)=4,26Так как нулевую гипотезу о равенстве групповых средних отвергаем. То есть групповые средние “в целом ” различаются значимо.

Page 20: Содержание:€¦  · Web view“Доверительные интервалы” Цель работы : Овладение методом составления доверительных