Файл: Задача 1 в результате некоторого тестирования 20 испытуемых была получена следующая выборка 5, 7, 9, 4, 7, 5, 4, 4, 9, 7, 5, 4, 5, 4, 5, 5, Ранжировать ряд..docx
Добавлен: 24.04.2024
Просмотров: 8
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Задача 1
В результате некоторого тестирования 20 испытуемых была получена следующая выборка: 5, 7, 9, 4, 7, 5, 4, 4, 9, 7, 5, 4, 5, 4, 5, 5, . . .
1 Ранжировать ряд.
2 Записать вариационный ряд, учитывая значение варианты 6.
3 Найти относительные частоты.
4 Построить графическую иллюстрацию ряда.
5 Найти числовые характеристики (моду, медиану, средне выборочное значение, размах, дисперсию, среднеквадратическое отклонение, коэффицент вариации).
Решение:
Имеем выборку объема N = 25. Построим ранжированный (в порядке возрастания) ряд вариант с соответствующими им частотами. Для этого сначала ранжируем варианты выборки.
Получаем:
2, 3, 3, 4, 4, 4, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 11, 11.
Подсчитав количество повторений каждой варианты, получим требуемый дискретный вариационный ряд распределения выборки с. в. X:
| 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 1 | 2 | 3 | 1 | 3 | 5 | 3 | 3 | 2 | 2 |
Полигоном частот называют ломанную, отрезки который соединяют точки (X1, N1), (X2, N2), …, (Xk, Nk).
Д
ля построения полигона частот на оси абсцисс откладывают
варианты Xi, а на оси ординат – соответствующие им Ni. Точки (Xi, Ni) соединяют отрезками прямых и получают полигон частот:
Для определения частостей вариант нужно вычислить для каждой варианты отношение Ni/N = WI, где N = 25 – объем выборки.
Получаем вариационный ряд вариант с соответствующими им частостями:
| 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 0,04 | 0,08 | 0,12 | 0,04 | 0,12 | 0,2 | 0,12 | 0,12 | 0,08 | 0,08 |
Статистической функцией распределения называется относительная частота (частность) того, что признак примет значение, меньшее заданного , т. е.
Запишем значения статистической (эмпирической) функции распределения в аналитическом виде:
Ее график имеет вид:
Определим выборочную среднюю:
.
Вычислим дисперсию:
Медианой вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений:
Модой называется варианта, которой соответствует наибольшая частота:
Задача 2
Автоконцерн утверждает, что доля автомобилей с несрабатывающими подушками безопасности не превосходит 4. В партии объемом 170 машин оказалось 8 автомобилей которые не прошли краш-тест. Не противоречит ли это утверждению производителя? Доверительная вероятность 0,95.
Решение:
Доля автомобилей, не прошедших тест
ω=10200=0,05
Средняя ошибка выборки для автомашин, не прошедших тест
∆ω=ω(1-ω)n=0,05(1-0,05)200=0,05∙0,95200=0,0002375=0,0154
μω=tω∙∆ω
Значение определяем по таблице распределения Лапласа:
Φt=γ2=0,992=0,495;t=2,58
μω=tω∙∆ω=0,0154∙2,58=0,039732
Таким образом, имеем:
0,05-0,039732≤ω≤0,05+0,039732;
0,010268≤ω≤0,089732
Средняя ошибка выборки для доли автомобилей, не прошедших тест, с вероятностью 0,99 находится в пределах от 0,010268 до 0,089732, что говорит о том, что не противоречит утверждению производителя.
Задача 3
Проводились испытания новых подгузников. В эксперименте участвовали 1300 мальчиков и 1330 девочек. У 170 мальчиков и 165 девочек наблюдались аллергические реакции.
Можно ли утверждать, что аллергические реакции от новых подгузников у девочек возникают не чаще, чем у мальчиков?
Доверительная вероятность равна 0,99.
Решение:
Пусть р1 – процент аллергических реакций от новых подгузников у девочек, р2 –процент аллергических реакций у мальчиков.
Введем нулевую гипотезу на уровне значимости :
Н0: р1 = р2 при конкурирующей гипотезе Н1: р1> р2
Критическое значение двусторонней критической области найдём из соотношения .
В данном случае:
По таблице функций Лапласа определяем
При нулевая гипотеза принимается, а при – отвергается:
Вычислим наблюдаемое значение критерия по формуле:
где m1=115;n1=1900;m2=120;n2=1800
Подставляем значения:
Uнабл=1151900-1201800115+1201900+18001-115+1201900+180011900+11800 =
=115∙18-120∙191900∙1823537001-235370018+191900∙18=-2101900∙182353700∙34653700∙371900∙18=
=-7190∙62353700∙3465100∙11900∙18=-7190∙6∙11000∙235∙346537∙19∙18=-7114100∙64,35=
=-71,14∙8,022≈-0,765
Так как U набл=0,765<1,96=uкр, то полученное значение попало в область принятия гипотезы, о том что аллергеческие реакции у девочек возникают не чаще чем у мальчиков.
Задача 4
Два человека дегустируют 10 сортов кофе. Каждый из них расположил эти сорта в порядке убывания предпочтений.
Дегустатор 1 | 7 | 1 | 5 | 10 | 2 | 8 | 9 | 6 | 3 | 4 |
Дегустатор 2 | 1 | 8 | 2 | 5 | 10 | 4 | 7 | 6 | 3 | 9 |
Есть ли какая-нибудь связь между этими результатами? Доверительная вероятность 0,99.
Решение:
Два человека дегустируют 10 сортов кофе. Каждый из них расположил эти сорта в порядке убывания предпочтений (второй и третий столбцы).
Есть ли какая-нибудь разница между этими результатами? Доверительная вероятность р=95%.
Сорт кофе | Дегустатор 1 | Дегустатор 2 |
А | 7 | 1 |
Б | 1 | 8 |
В | 5 | 2 |
Г | 10 | 5 |
Д | 2 | 10 |
Е | 8 | 4 |
Ж | 9 | 7 |
З | 6 | 6 |
И | 3 | 3 |
К | 4 | 9 |
Заполним таблицу:
Сорт кофе | Дегустатор 1 | Дегустатор 2 | d | d2 |
А | 6 | 5 | 1 | 1 |
Б | 4 | 6 | -2 | 4 |
В | 3 | 4 | -1 | 1 |
Г | 10 | 7 | 3 | 9 |
Д | 5 | 1 | 4 | 16 |
Е | 1 | 2 | -1 | 1 |
Ж | 8 | 8 | 0 | 0 |
З | 2 | 3 | -1 | 1 |
И | 7 | 9 | -2 | 4 |
К | 9 | 10 | -1 | 1 |
Сумма | - | - | - | 38 |
d- это разность между значениями дегустаторов для одного и того же сорта чая, то есть 4-й столбец – это разность 2-го и 3-го столбцов. Каждое число 4-го столбца возводим в квадрат и результат записываем в 5-й столбец. В последней строке указана сумма чисел 5-го столбца.
Гипотеза Н0: между результатами этих исследований нет связи, они несогласованны друг с другом.
Гипотеза Н1: между результатами этих исследований существует связь.