Файл: Учебное пособие Киров 2010 удк 311(075. 8) Ббк 60. 60я73 К91.doc
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 29.04.2024
Просмотров: 104
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Момент остановки этого процесса может задаваться исследователем (например, указанием требуемого числа кластеров или максимального расстояния, при котором достигнуто объединение).
Графическое изображение процесса объединения кластеров может быть получено с помощью дендрограммы — дерева объединения кластеров.
Рассмотрим следующий пример. Проведем классификацию пяти предприятий, каждое из которых характеризуется тремя переменными:
х1 – среднегодовая стоимость основных производственных фондов, млрд руб.;
х2 – материальные затраты на 1 руб. произведенной продукции, коп.;
х3 – объем произведенной продукции, млрд руб.
В таблице приведены соответствующие значения для каждого из предприятий:
Исходные данные | |||
предприятие | х1 | х2 | х3 |
№ 1 | 120 | 94,0 | 164 |
№ 2 | 85 | 75,2 | 92 |
№ 3 | 145 | 81,0 | 120 |
№ 4 | 78 | 76,9 | 86 |
№ 5 | 70 | 75,9 | 104 |
На рис. 5 приведена искомая дендрограмма, демонстрирующая объединение предприятий-кластеров на базе оценки евклидова расстояния между ними в пространстве переменных х1 , х2 и х3.
Изучение дендрограммы на рис. 5 приводит к следующим выводам. Среди пяти предприятий, если следовать слева направо, можно обнаружить следующие два кластера:
кластер № 1: предприятия: № 5, № 4, № 2;
кластер № 2: предприятия: № 3, № 1.
Рис. 5. Дендрограмма пяти предприятий
Обратными агломеративным методам кластеризации являются дивизивные методы. В этом подходе исходят из того, что вначале все объекты относят к одному кластеру, далее по определенным правилам появляются два и более кластера и т. д. вплоть до количества кластеров, равного количеству объектов.
Результаты кластеризации зависят от выбранного метода, и эта зависимость тем сильнее, чем менее явно изучаемая совокупность разделяется на группы объектов. Поэтому к результатам вычислительной кластеризации следует относиться с осторожностью.
Многомерное шкалирование
Во многих областях исследования (например, в психологии, биологии, социологии, лингвистике и т. д.) бывает затруднительно или невозможно проводить непосредственное измерение интересующих исследователя характеристик объектов из изучаемой совокупности, зато можно экспертным или каким-то другим путем оценить степень сходства или различия между парами объектов. В этом случае для интерпретации получаемых данных применяется метод многомерного шкалирования.
Этот метод позволяет представить совокупность интересующих исследователя объектов в виде некоторого набора точек многомерного пространства некоторой небольшой размерности, при этом каждому объекту соответствует одна точка. Координаты точек истолковываются как значения неких характеристик исходных объектов, которые и объясняют их свойства или взаимоотношения.
Например, нас интересуют такие объекты, как города, в которых проживают люди. Город в целом характеризуется огромным количеством признаков. К важнейшим из признаков относятся: географическое положение, климат и политическая принадлежность.
В случае удачного шкалирования исследователь получает возможность представить изучаемую совокупность объектов наглядно.
В методе многомерного шкалирования применяют нехарактерную для статистики в целом терминологию: стимул, шкала, эксперт и др.
Под стимулом понимается некоторый признак, свойство, характерная особенность объекта, стимул непосредственно не измеряется.
Шкала — одна из осей теоретического пространства, она характеризует численно (метрически) тот или иной признак, свойство, характерную особенность объекта.
Эксперт — субъект, который считается признанным авторитетом в оценке признаков, свойств и характерных особенностей исследуемых объектов.
Методы контроля качества
Методы контроля качества предназначены для контроля качества выпускаемой продукции с целью выявления нарушений и «узких мест» в организации производства и в технологических процессах.
Повсеместное применение научно обоснованных методов контроля качества явилось немаловажным фактором успехов стран-лидеров мировой экономики, в особенности Японии.
В последнее время новые методы более эффективного управления с целью повышения качества получили название «шесть сигм». Они рассматриваются как формула успеха большинства транснациональных корпораций.
В отличие от большинства описанных выше методов многомерного анализа методы контроля качества не требуют трудоемких вычислений — они исключительно просты и наглядны. Простота, наглядность и эффективность статистических методов контроля качества сделали возможным и оправданным их повсеместное применение в передовых странах, вплоть до мастеров, а иногда и отдельных рабочих.
Тест к теме 9
1. Проверка значимости параметров уравнения регрессии осуществляется на основе:
а) критерия Стьюдента;
б) множественного коэффициента корреляции;
в) коэффициента детерминации.
2. Коэффициент детерминации измеряет:
а) вариацию, сложившуюся под влиянием всех факторов;
б) долю вариации признака-результата, сложившуюся под влиянием изучаемого фактора;
в) вариацию, связанную с влиянием всех остальных факторов, кроме исследуемого;
г) степень тесноты связи между явлениями.
3. Если коэффициент линейной корреляции равен 0,85, то связь между признаками:
а) отсутствует; в) умеренная;
б) слабая; г) сильная.
4. Какой из линейных коэффициентов корреляции указывает на наибольшую тесноту связи:
а) 0,80; в) 0,40; д) - 0,85?
б) -0,45; г) 0;
5. Какой из линейных коэффициентов корреляции указывает на наименьшую тесноту связи:
а) 0,80; в) 0,40; д) - 0,85?
б) -0,45; г) 0;
6. По направлению различают связи:
а) прямые; в) возрастающие и убывающие;
б) прямолинейные; г) умеренные.
7. По аналитическому выражению связи в статистике классифицируют:
а) на сильные и слабые; в) прямые и обратные;
б) закономерные и произвольные; г) линейные и криволинейные.
8. В каких пределах измеряется коэффициент корреляции:
а) от 0 до 1; б) от -1 до +1; в) от -1 до 0?
9. Уравнение регрессии имеет вид: . На сколько единиц своего измерения в среднем изменится у при увеличении х на одну единицу своего измерения:
а) увеличится на 1,7; в) не изменится;
б) уменьшится на 1,7; г) увеличится на 5,1?
10. Какой коэффициент указывает в среднем процент изменения результативного показателя у при увеличении аргумента х на 1%:
а) коэффициент корреляции; в) коэффициент эластичности;
б) коэффициент детерминации; г) коэффициент регрессии?
11. Какая из следующих формул минимизируется в методе наименьших квадратов:
а) ; б) ; в) ; г)
12. Если результативный и факторный признаки являются количественными, то для анализа тесноты связи между ними могут применяться:
а) коэффициенты ассоциации;
б) коэффициент корреляции рангов Спирмена;
в) коэффициент корреляции знаков Фехнера;
г) линейный коэффициент корреляции;
д) корреляционное отношение.
13. Частный коэффициент корреляции показывает тесноту:
а) нелинейной зависимости;
б) связи между результативным признаком и остальными, включенными в модель;
в) линейной зависимости между двумя признаками на фоне действия остальных, входящих в модель;
г) линейной зависимости между двумя признаками при исключении влияния остальных, входящих в модель.
14. К методам многомерного статистического анализа относится:
а) дискриминантный анализ; б) индексный анализ; в) корреляционный анализ.
15. Метод главных компонент заключается:
а) в изучении различий объектов наблюдения с помощью разбиения их по признакам;
б) в нахождении новой ортогональной системы координат в пространстве наблюдений;
в) нет верного ответа.
16. С помощью многомерного анализа исследуется:
а) изменение двух признаков;
б) изменение нескольких признаков;
в) динамика одного социально-экономического процесса.
17. Кластерный анализ позволяет:
а) строить функции измеряемых характеристик;
б) представлять изучаемые характеристики в ортогональной системе координат;
в) проводить классификацию объектов с учетом всех тех признаков, которые характеризуют объект.
18. Метод многомерного шкалирования предполагает:
а) построение функции измеряемых характеристик;
б) представление совокупности объектов в виде набора точек многомерного пространства;
в) представление изучаемых характеристик в ортогональной системе координат.
Задачи для решения
-
По следующим данным постройте линейное уравнение регрессии, вычислите линейный коэффициент корреляции: -
Используя следующие данные, определите параметры линейного уравнения ( и ) регрессии: -
По следующим данным постройте линейное уравнение регрессии, вычислите линейный коэффициент корреляции: -
Имея следующие данные, постройте линейное уравнение регрессии:
5. Имеются данные по 10 семьям об уровне доходов на 1 человека в год (х) и покупательском спросе – расходах на одежду на 1 чел. в год (у), в млн руб. Методом корреляционного анализа исследовать зависимость между этими признаками. Написать уравнение регрессии, построить эмпирические точки и линию регрессии. Найти коэффициенты корреляции и детерминации. Сформулировать выводы по результатам анализа.