ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 29.03.2024
Просмотров: 14
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Задание 1
По исходным данным, представленным в таблице 1, составить два ряда распределения – один дискретный, другой интервальный. По каждому ряду выполнить группировку данных, определить абсолютные, относительные и интегральные частоты, определить средние арифметические и структурные величины, показатели вариации. Сделать обоснованные выводы о качественных особенностях ряда и проиллюстрировать результаты графиками (гистограмма и кумулята для интервального ряда, полигон и кумулята для дискретного ряда). Ручные расчеты дополнить данными, полученными с помощью надстройки «Описательная статистика» пакета Microsoft Excel (Файл – параметры - надстройки – анализ данных – описательная статистика), выявить и пояснить причины расхождения полученных результатов.
Таблица 1 - Данные варианта
Вариант | Ряд 1 | Ряд 2 | ||
признак | номера | признак | номера | |
1 | Стаж работы | 1-45 | Зарплата за январь | 1-45 |
Таблица 2 - Данные для расчета
Порядковый номер | Стаж работы | Зарплата за январь | Порядковый номер | Стаж работы | Зарплата за январь |
1 | 5 | 27600 | 24 | 3 | 18700 |
2 | 3 | 20100 | 25 | 1 | 16300 |
3 | 4 | 24400 | 26 | 1 | 16800 |
4 | 5 | 25300 | 27 | 4 | 21000 |
5 | 3 | 23600 | 28 | 1 | 15100 |
6 | 3 | 27100 | 29 | 2 | 13700 |
7 | 5 | 21000 | 30 | 2 | 14200 |
8 | 5 | 21600 | 31 | 1 | 14500 |
9 | 3 | 17800 | 32 | 3 | 18000 |
10 | 5 | 21300 | 33 | 5 | 18720 |
11 | 4 | 24000 | 34 | 3 | 17440 |
12 | 5 | 21800 | 35 | 5 | 20100 |
13 | 1 | 22000 | 36 | 3 | 18170 |
14 | 2 | 21600 | 37 | 2 | 20260 |
15 | 2 | 19400 | 38 | 1 | 14130 |
16 | 2 | 17400 | 39 | 3 | 14540 |
17 | 4 | 20900 | 40 | 1 | 10470 |
18 | 1 | 16300 | 41 | 3 | 14680 |
19 | 2 | 14900 | 42 | 3 | 13800 |
20 | 3 | 16000 | 43 | 1 | 15400 |
21 | 2 | 16200 | 44 | 4 | 27040 |
22 | 2 | 17300 | 45 | 2 | 11680 |
23 | 2 | 16100 | | | |
Выполнение задания:
Дискретный ряд
1. Ряд 1 – Стаж работы
Сгруппируем данные по стажу работы, определим абсолютные, относительные и интегральные частоты и представим в таблице 1.
Таблица 1 – Сгруппированные данные работников строительного треста по стажу работу
Стаж работы ,xi | Кол-во рабочих, fi | Накопленная абсолютная частота, S (интегральная) | Удельный вес, % | Накопленная относительная частота S1, %(интегральная) |
1 | 9 | 9 | 20,00 | 20,00 |
2 | 11 | 20 | 24,44 | 44,44 |
3 | 12 | 32 | 26,67 | 71,11 |
4 | 5 | 37 | 11,11 | 82,22 |
5 | 8 | 45 | 17,78 | 100,00 |
Итого | 45 | | 100 | |
Для определения средних арифметических и структурных величин, показателей вариации составим расчетную таблицу 2.
Таблица 2 – Расчетные данные
Стаж работы ,xi | Кол-во рабочих, fi | xi * fi | Накопленная частота, S | |x - xср|*fi | (x - xср)2*fi |
1 | 9 | 9 | 9 | 16,4 | 29,884 |
2 | 11 | 22 | 20 | 9,044 | 7,437 |
3 | 12 | 36 | 32 | 2,133 | 0,379 |
4 | 5 | 20 | 37 | 5,889 | 6,936 |
5 | 8 | 40 | 45 | 17,422 | 37,942 |
Итого | 45 | 127 | | 50,889 | 82,578 |
1. Средние показатели
Средняя взвешенная (выборочная средняя)
года
Мода.
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Максимальное значение повторений при x = 3 (f = 12). Следовательно, мода равна 3.
Медиана.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 23. Это значение xi = 3года. Таким образом, медиана равна 3 лет.
Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных.
2. Структурные показатели.
Степень асимметрии.
Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.
Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии.
As = M3/s3
где M3 - центральный момент третьего порядка.
s - среднеквадратическое отклонение.
M3 = 30.29/45 = 0.67
Положительная величина указывает на наличие правосторонней асимметрии.
Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии:
Если выполняется соотношение |As|/sAs < 3, то асимметрия несущественная, ее наличие объясняется влиянием различных случайных обстоятельств. Если имеет место соотношение |As|/s
As > 3, то асимметрия существенная и распределение признака в генеральной совокупности не является симметричным.
Расчет центральных моментов проводим в аналитической таблице 3
Таблица 3- Расчет центральных моментов
xi | (x - xср)3*fi | (x - xср)4*fi |
1 | -54,46 | 99,23 |
2 | -6,11 | 5,03 |
3 | 0,067 | 0,012 |
4 | 8,17 | 9,62 |
5 | 82,63 | 179,95 |
Итого | 30,29 | 293,84 |
В анализируемом ряду распределения наблюдается несущественная асимметрия (0.271/0.612 = 0.44<3)
Применяются также структурные показатели (коэффициенты) асимметрии, характеризующие асимметрию только в центральной части распределения, т.е. основной массы единиц, и независящие от крайних значений признака. Рассчитаем структурный коэффициент асимметрии Пирсона:
Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.
Чаще всего эксцесс оценивается с помощью показателя:
Для распределений более островершинных (вытянутых), чем нормальное, показатель эксцесса положительный (Ex > 0), для более плосковершинных (сплюснутых) - отрицательный (Ex < 0), т.к. для нормального распределения M4/s4 = 3.
M4 = 293.84/45 = 6.53
Число 3 вычитается из отношения μ4/ σ4 потому, что для нормального закона распределения μ4/ σ4 = 3. Таким образом, для нормального распределения эксцесс равен нулю. Островершинные кривые обладают положительным эксцессом, кривые более плосковершинные - отрицательным эксцессом.
Ex < 0 - плосковершинное распределение
Чтобы оценить существенность эксцесса рассчитывают статистику Ex/sEx
где sEx - средняя квадратическая ошибка коэффициента эксцесса.
Если отношение Ex/sEx > 3, то отклонение от нормального распределения считается существенным.
Поскольку sEx < 3, то отклонение от нормального распределения считается не существенным.