Файл: Методические указания к проведению практических занятий по разделу математическая статистика дисциплины Основы системного анализа и математической статистики..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.03.2024

Просмотров: 21

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

15

Интервальная оценка вероятности события

При рассмотрении точечных оценок было показано, что "хорошей" оценкой вероятности события является частость w = m / n, где m – число испытаний, в которых произошло событие А, а n – общее число независимых испытаний, в каждом из которых событие А может произойти с вероятностью р или не произойти с вероятностью q = 1 – р (т.е. последовательность испытаний Бернулли).

Построение доверительного интервала для вероятности в этом случае (при больших значениях n 100) осуществляется по формуле:

P w t w 1n w p w t w 1n w 2 t ,

где t – значение стандартной нормальной величины, соответствующее надежности Ф t γ/2, а Ф t – функция Лапласа

Пример 6.

Произведено 5 независимых испытаний. С. в. Х ~ N (a; 20). Результаты наблюдений: х1 25, х2 34,х3 20,х4 10,х5 21. Найти оценку для математического ожидания а и построить для него 95% доверительный интервал.

Решение:

Находим x 1n ( 25 34 20 10 21) 4.

По условию 0,95 , следовательно Ф(t) 2 0,295 0,475.

По таблице значений функции Лапласа находим t t 1,96.

Тогда 1,96 20 17,5.

5

Доверительный интервал имеет вид: (4 17,5; 4 17,5) или ( 13,5; 21,5).

16

Пример 7.

По условию примера 6, считая, что случайная величина X ~ N (а, ), построить доверительный интервал для неизвестного с надежностью.

0,95 .

Решение:

Воспользуемся результатом примера 6: x 4. Находим значение:

2 14 (( 25 4)2 (34 4)2 ( 20 4)2 (10 4)2 (21 4)2 660,5

 

2

25,7 .

 

 

Для

0,95

и (n 1) 4

по таблице находим t

2,78. Следовательно

2,78

25,7

 

31,9.

 

 

2,24

 

 

 

 

 

 

 

 

 

Доверительный интервал: ( 27,9; 35,9)

Пример 8.

Измерения твердости 16 образцов легированной стали (в условных единицах) дали следующие результаты:

 

 

 

 

 

 

Таблица 5

13,1

12,8

11,9

12,4

13,5

13,7

12,0

13,8

10,6

12,4

13,5

11,7

13,9

11,5

12,5

11,9

В предположении,

что выборка измерений получена из нормально

распределенной генеральной совокупности, найти доверительные интервалы для среднего и дисперсии при доверительной вероятности 0,95.

Решение:

Математическое ожидание а неизвестно, по выборке найдем

 

 

1

16

201,2

 

 

 

 

 

 

х

 

хi

16

12,58

,

 

 

 

16 i 1

 

 


17

 

 

 

1

n

 

 

 

 

 

 

 

 

S

(хi х)2

 

0,91 0,95.

 

 

 

 

 

 

 

 

 

 

15 i 1

 

 

 

 

По таблице распределения Стьюдента для k 16 1 15

и

0,95

находим t

t0,95

2,13.

 

 

 

 

 

 

 

 

Доверительный интервал для математического ожидания имеет вид

 

 

 

 

 

 

2,13

0,95

; 12,58 2,13

0,95

,

 

 

 

 

 

12,58

16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

 

 

 

 

 

 

 

 

(12,08; 13,09).

 

 

 

 

 

 

По таблице распределения k2

для

k 16 1 15 ,

 

0,95 находим

квантили

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

2

6,26

и

2

 

2

 

2

 

25,0.

1

1 0,95

 

0.975,15

2 1 0.95

 

0.05,15

 

 

 

,16

1

 

 

 

 

 

 

 

,16 1

 

 

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доверительный интервал для неизвестного имеет вид:

 

 

 

 

 

 

 

16 1 0,95

 

16 1 0,95

 

 

 

 

 

 

 

 

 

 

 

;

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25,0

 

 

6,26

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,74; 1,47 .

 

 

 

 

 

Пример 9

Найти минимальный объем выборки, на основании которой можно было бы оценить математическое ожидание времени исполнения некоторой технической операции с ошибкой, не превышающей 10с и надежностью 0,95, если предположить, что время исполнения этой операции имеет нормальное распределение со средним квадратическим отклонением 50.

Решение:

Погрешность оценки математического ожидания при известной дисперсии выражается формулой:

n U 2

 

 

 

 

2U 2

По условию ε ≤ 10. Поэтому

10,

откуда n

2

 

U 2

 

n

100


18

По таблицам функции Лапласа при доверительной вероятности 1 0,95 находим квантиль U 2 U0,25 1,96.

Тогда n ≥ 96 и nmin = 9.

4. Методы статистической проверки гипотез.

Критерии согласия Стьюдента, Фишера, Пирсона, Колмогорова

Статистическая гипотеза называется параметрической, если предположения касаются значений параметров распределения, и – непараметрической, если содержит предположения о виде закона распределения.

4.1. Т - критерий Стьюдента для несвязных выборок

Т-критерий Стьюдента

направлен

на оценку различий величин

средних

 

и

 

двух выборок

X и Y ,

которые распределены по

X

Y

нормальному закону. Он может быть использован для сопоставления средних у связных и несвязных выборок, причем выборки могут быть не равны по величине.

В общем случае формула для расчета наблюдаемого значения критерия tэмп по t - критерию Стьюдента для несвязных выборок такова:

tэмп

 

X

 

Y

 

,

Sd

 

 

 

 

где Sd

Sx2 S y2

Для равночисленных выборок с объемами n n1 n2 выражение для Sd имеет вид:

 

 

 

 

(xi

 

)2 (yi

 

)2

 

Sd

2

2

 

X

Y

.

Sx

S y

 

(n 1) n

 

 

 

 

 

 

Для неравночисленных выборок n1 n2 , выражение будет вычисляться следующим образом:


19

 

 

 

 

(xi

 

)2

 

(yi

 

)2

 

(n1 n2 )

 

2

2

 

X

Y

 

Sd

S x

S y

 

 

 

 

 

 

 

 

 

 

 

(n1

n2

2)

(n1

n2 )

 

 

 

 

 

В обоих случаях подсчет числа степеней свободы осуществляется по формуле: k (n1 1) (n2 1) n1 n2 2

Пример 10.

Представлены результаты измерения времени сложной сенсомоторной реакции выбора (в мс) в группе X , состоящей из 9 спортсменов высокой квалификации и в группе Y , состоящей из 8 человек, активно не занимающихся спортом. С помощью t - критерия Стьюдента проверить гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.

Результаты эксперимента представим в виде таблицы 6, в которой произведем ряд необходимых расчетов.

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

группы

отклонение от

 

квадраты

среднего

отклонений

 

 

 

X

Y

xi

X

 

yi

Y

 

(xi

X

)2

(yi

Y

)2

1

504

580

-22

 

-58

 

484

 

3364

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

560

692

34

 

 

54

 

 

1156

 

2916

 

 

 

 

 

 

 

 

 

 

 

 

3

420

700

-106

 

62

 

 

11236

3844

 

 

 

 

 

 

 

 

 

 

 

 

 

4

600

621

74

 

 

-17

 

5476

 

289

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

580

640

54

 

 

2

 

 

2916

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

530

561

4

 

 

-77

 

16

 

5929

 

 

 

 

 

 

 

 

 

 

 

 

 

7

490

680

-36

 

42

 

 

1296

 

1764

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

580

630

54

 

 

-8

 

 

2916

 

64

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

470

-

-56

 

-

 

 

3136

 

-

 

 

 

 

 

 

 

 

 

 

 

 

 

4734

5104

0

 

 

-17

 

28632

18174

среднее

526

638

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


20

Решение:

Среднее арифметическое в экспериментальной группе X 47349 526.

Среднее арифметическое в контрольной группе Y 51048 638.

Разница по абсолютной величине между средними

X Y 526 638 112.

Подсчет выражения дает Sd

(28632

18174)

 

(9 8)

 

736,76 27,14.

 

 

 

 

 

 

 

 

 

 

(9

8 2)

 

(9 8)

 

 

 

 

 

 

 

 

 

 

112

 

 

 

 

 

 

Следовательно tэмп

 

X

Y

 

 

 

 

4,13.

 

 

 

 

Sd

27,14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число степеней свободы k 9 8 2 15. Для данного числа степеней свободы и 0,001находимtкр 4,07.

Таким образом, при 0,001, средняя скорость сложной

сенсомоторной реакции выбора в группе спортсменов существенно

выше, чем в группе людей, активно не занимающихся спортом делаем

вывод: на 0,1% уровне значимости принимается гипотеза о различии

между группами.

4.2Т - критерий Стьюдента для связных выборок.

Вслучае связных выборок с равным числом измерений в каждой

можно использовать более простую формулу t - критерия Стьюдента:

 

tэмп

 

d

 

 

 

 

 

 

di

 

(xi yi )

 

 

 

, где d

 

 

 

Sd

n

n

 

 

 

 

 

 

 

 

di xi

yi разности между соответствующими значениями

переменной X и переменной Y , а

 

среднее этих разностей.

d