Файл: Теория вероятностей и математическая статистика Задание на расчетную работу 1 Основы статистики.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 05.05.2024

Просмотров: 16

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Все полученные результаты сводятся в таблицу.

Номер интервала

Границы интервалов









1












2

























При этом

Гистограмма строится следующим образом. На оси абсцисс откладываются интервалы, и на каждом из них строится прямоугольник, площадь которого равна относительной частоте, соответствующей этому интервалу, т.е. высота прямоугольника (ордината) равна , так что полная площадь гистограммы равна 1. Таким образом, гистограмма является эмпирическим аналогом плотности распределения. Так как множители можно рассматривать как масштабные, то по оси ординат можно откладывать частоты или , (правда, в этом случае площадь всех прямоугольников будет равна ).


Полигон частот - ломаная линия, которая получается, если из середины

каждого интервала восстановить перпендикуляр высотой (или ) и соединить вершины этих перпендикуляров. Полигон частот чаще используют

при дискретной группировке.
  1. Задание


  1. Выполнить группировку исходных данных своего варианта по значению признака.

  2. Вычислить основные числовые характеристики:

    1. Выборочное среднее.

    2. Выборочную дисперсию.

    3. Стандартное отклонение.

    4. Коэффициент вариации.

    5. Оценка коэффициента асимметрии.

    6. Оценка эксцесса.

    7. Выборочная мода.

    8. Выборочная медиана.

  3. Выполнить предварительную проверку на нормальность.

  4. Построить гистограмму и полигон частот.
  1. Пример выполнения


Для выполнения задания будем использовать выборку объемом 15 элементов:



Выполним группировку исходных данных по значению признака. Для этого упорядочим выборку по возрастанию, и, используя формулы =МИН() и =МАКС() найдем минимальное и максимальное значения выборки:



Далее посчитаем частоты, для этого разобьем выборку на пять интервалов одинаковой длины. Для того, чтобы узнать шаг , воспользуемся формулой:





Для подсчета частот построим таблицу:



В этой таблице в шапке указаны границы интервалов, от минимального до максимального значений выборки с шагом , в нижней строке укажем количество значений, попавших в каждый интервал:




Для удобства, значения, попавшие в одинаковый интервал, выделены одним цветом.

Найдем относительные частоты:



Выполним контроль: сумма частот должна быть равна объему выборки, а сумма относительных частот единице:



Используя формулы, вычислим выборочное среднее:



В диапазоне ячеек B1:P1 находится выборка.

Выборочную дисперсию:



Ячейка D8 – это значение выборочного среднего.

Среднее квадратическое отклонение:



D9 – ссылка на ячейку, в которой находится значение дисперсии.

Далее вычислим коэффициент вариации, разделив среднее квадратическое отклонение на выборочное среднее:



Для расчета значений коэффициентов асимметрии и эксцесса нам потребуются значения центральных моментов второго, третьего и четвертого порядков. Для этого для каждого элемента выборки найдем его разность с выборочным средним:



В ячейке D8 находится выборочное среднее. Затем возведем каждую разность во вторую, в третью и в четвертую степени:



Найдем сумму значений в каждой строке и разделим на объем выборки:



Полученные значения и есть центральные моменты второго, третьего и четвертого порядка:



.


Вычислим асимметрию:



Здесь в ячейке Q20 – значение центрального момента третьего порядка, а в ячейке Q19 – значение центрального момента второго порядка.

Для оценки эксцесса наберем формулу:



В ячейке Q21 значение центрального момента четвертого порядка.

Далее вычислим моду и медиану. Для расчета моды потребуется интервал с максимальной частотой. В нашем случае =4, тогда =7, = 0,312, =3, =2. Наберем формулу:



Наконец, для расчета медианы определим интервал, удовлетворяющий условиям:



то есть, нужно найти такой интервал, в котором сумма частот превышает половину объема выборки. В нашем случае номер такого интервала =4, так как на третьем интервале сумма частот меньше половины объема выборки: , а на четвертом интервале . Тогда =0,312, =7, =1+2+3=6, =15/2=7,5, =0,774. Наберем формулу:



Окончательно получим значения основных числовых характеристик:



Выполним предварительную проверку на нормальность.

1. Рассчитаем границы интервалов
, и :



В ячейке D8 находится значение выборочного среднего, в ячейке D10 значение среднего квадратического отклонения. Посчитаем, сколько значений выборки попадает в образованные интервалы:



В последнем столбце указаны процентные соотношения полученных значений от объема выборки. Полученные значения позволяют говорить о том, что по первому критерию выборка является нормальной.

2. Оценка эксцесса и коэффициента асимметрии ‚ должны быть близки к нулю; Значение эксцесса =0,134, значение коэффициента асимметрии =-0,665. Эти значения достаточно малы, чтобы принять их незначимо отличными от нуля.

3. , в нашем случае .

Учитывая все три критерия, можно говорить о том, что выборка является нормальной.

Наконец, используя средства построения графиков Excel, построим гистограмму и полигон частот: