Файл: Лекции Человечество и цифровой мир.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 02.02.2024

Просмотров: 269

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Тесты к лекции «Основные понятия анализа цифровых данных»
1. Часть
совокупности
изучаемых
объектов,
отбираемая
специальным образом, в которой значения переменных распределены в

процентном соотношении приблизительно так же, как и в реальной
жизни называется …
A) репрезентативной выборкой
B) репрезентативной гипотезой
C) генеральной выборкой
D) генеральной гипотезой
2. Формирование
репрезентативной
выборки,
проверка
правдоподобности представленных данных и заполнение пропущенных
значений осуществляются на этапе …
A) разведочного анализа данных
B) сбора и подготовки данных
C) очистки данных от шумов и аномалий
D) преобразования данных
3. Расставьте
буквы
в
соответствии
с
хронологической
последовательностью этапов анализа данных (например, ABCDEFGH).
A) очистка данных от шумов и аномалий -5
B) преобразование данных -6
C) построение моделей -7
D) интерпретация-8
E) описание изучаемых объектов-1
F) формулировка гипотез -2
G) сбор и подготовка данных -3
H) разведочный анализ данных -4
4. Значения переменной: Пекин, Москва, Ханой, Париж, Лондон
соответствуют … шкале измерений.
A) номинальной
B) порядковой
C) интервальной
D) относительной
5. Переменные, принимающие только два возможных значения,
называют …
A) унарными
B) альтернативными
C) дихотомическими (бинарными)
D) взаимоисключающими
6. Числовой
или
символьный
ряд
значений,
отражающий
допустимые вариации измеряемой величины, называют …
A) временным рядом
B) шкалой измерений
C) распределением значений
D) вариационным рядом
7. Качественные шкалы измерений:
A) номинальная
B) интервальная
C) порядковая
D) относительная
E) дихотомическая

8. Количественные шкалы измерений:
A) номинальная
B) интервальная
C) порядковая
D) относительная
F) дихотомическая
9. Предназначена для классификации объектов и состоит из
названий, имен или категорий – … шкала.
A) интервальная
B) порядковая
C) относительная
D) номинальная
10. Предназначена для обозначения относительных качественных
позиций объектов – … шкала.
A) интервальная
B) порядковая
C) относительная
D) номинальная
11. Имеет единицу измерения и произвольно выбранное начало
(условную нулевую точку) – … шкала.
A) интервальная
B) порядковая
C) относительная
D) номинальная
12. Имеет единицу измерения и обладает абсолютным нулем в
качестве точки отсчета – … шкала.
A) интервальная
B) порядковая
C) относительная
D) номинальная
13. Агрегированные данные не содержат в себе такие виды данных,
как …
A) транзакции
B) ряды
C) таблицы
D) фактоиды
14. Вид данных, в которых один вид информации (зависимая
переменная) сопоставляется другому виду информации (независимой
переменной), причем в качестве независимой переменной выступает
время – это …
A) временной ряд
B) временной фактоид
C) временная транзакция
D) интервальный ряд
15. Позволяет значительно сократить объемы анализируемых
данных и минимизировать время последующей обработки – …
A) облачная технология
B) метод агрегации
C) параллельная обработка данных
D) увеличенный объем памяти


16. Таблица содержит статистику сделанных прививок:
Мужчины
15473
Женщины
9466
Студенты
3118
Пенсионеры
1000
Агрегации (подсчету общего количества) можно подвергнуть
следующие категории данных:
A) мужчины
B) женщины
C) студенты
D) пенсионеры
17. Интерфейс для доступа к открытым данным социальной сети – …
A) FTTP
B) HTTP---
C) API+++
D) OSI
18. Источники данных, предоставляющие «сырые» транзакции без
всякой агрегации – …
A) структурированные документы
B) результаты прямых измерений
C) социологические опросы
D) поисковые системы
19. Расставьте
буквы
в
соответствии
с
хронологической
последовательностью этапов объединения данных из разных источников.
A) преобразование данных к одинаковым единицам
измерения и унифицированной лексике-3
B) разделение данных-2
C) преобразование данных к единой структуре-4
D) загрузка исходных данных в единое хранилище-1
20.
Таблица содержит сведения о временных перемещениях
автобуса. На остановке «УЛИЦА СОДРУЖЕСТВА» датчик не зафиксировал
время прибытия «Рейс 4».
Остановка
Время прибытия на остановки
Рейс1
Рейс2
Рейс3
Рейс4
АВТОСТОЯНКА
10:17:20 12:32:10 15:47:40 17:02:20
УЛИЦА СОДРУЖЕСТВА
10:19:00 12:34:10 15:49:30
ЛЬВОВСКАЯ УЛИЦА
10:21:30 12:36:40 15:51:30 17:07:20
Методом аппроксимации пропущенных значений (на основании
данных о прошлых прохождениях автобусом остановки «УЛИЦА
СОДРУЖЕСТВА») будет получено расчетное время прибытия …
A) 17:04:10
B) 17:04:20
C) 17:04:15
D)
17:04:32
21.
Укажите этапы очистки данных:
A) устранение дубликатов
B) контроль диапазонов
C) классификация данных
D) сравнение с образцами (шаблонами/регулярными выражениями)

22.
Расставьте
буквы
в
соответствии
с
хронологической
последовательностью стадий анализа данных для выявления скрытых
закономерностей.
A) 1)постановка задачи, выдвижение гипотез
B) 2)сбор и предподготовка данных
C) 3)выбор метода анализа данных
D) 4)проверка найденных закономерностей и анализ исключений
23.
В ходе Data Mining проекта (добычи и интеллектуального
анализа данных) получают список влияющих факторов с экспертной
оценкой их значимости на этапе …
A) сбора и предподготовки данных
B) постановки задачи и выдвижения гипотез++++
C) выбор метода анализа данных
D)валидации полученной модели

Тесты к лекции «Инструменты обработки_визуализация_ЦД»
1. Текстовый
формат,
предназначенный
для
представления
табличных данных, в котором значения разделяются специальными
символами-разделителями, называется - …
A) CSV
B) DOC
C) XLS
D) VGA
2. Перевод Excel в режим ввода формулы осуществляется после
ввода в активную ячейку символа …
A) >
B) =
C) «Enter»
D) *
3. Процесс изменения адресов ячеек в формуле при ее
копировании, называется - …
A) автозаполнение
B) автокопирование
C) автоиндексация
D) автоввод
4. Адрес ячейки в Excel, хранящий в себе не номер ее строки и имя
столбца, а путь, который необходимо проделать из ячейки с формулой до
адресуемой ячейки, называется - …
A) смешанным
B) относительным
C) абсолютным
D) индексируемым
5. Перед элементами адреса ячейки в Excel, которые не должны
изменяться при копировании, необходимо ставить знак …
A) $
B) =
C) :
D) ;
6. Автоиндексация в Excel не изменит номер строки в следующих
адресах ячеек:
A) A$1
B) $A1
C) $A$1
D) A1
7. Автоиндексация преобразует формулу Excel =A1+$A$2+A$3,
скопированную из ячейки A4 в ячейку B5, к следующему виду …
A) =B2+$A$2+B$3
B) =A2+$A$2+A$3
C) =B2+$B$2+B$3
D) =B5+$A$2+B$3
8. Ссылка на ячейку другого листа Excel содержит в себе, в качестве
разделителя между именем листа и адресом на ячейку в этом листе,
символ …
A) $


B) ?
C) !
D) ;
9. Примерами ссылок на диапазоны в Excel являются:
A) N5:P8;E18:H25;I5:L22
B) A2:A2; F:F
C) 1:1048576
D) А1:Я1
10. Выделенная в Excel прямоугольная область прилегающих ячеек
– это …
A) окно
B) рамка
C) маркер
D) диапазон
11. Формула в Excel, при попытке сложить числовое и текстовое
значения, вернет в качестве своего результата ошибку недопустимых
данных …
A)
#Н/Д
B) #ЗНАЧ!
C) #ДЕЛ/0!
D) #ИМЯ?
12. Формула в Excel, в случае наличия синтаксических ошибок в
написании функций или ссылок на ячейки, вернет в качестве своего
результата ошибку …
A) #Н/Д
B) #ЗНАЧ!
C) #ДЕЛ/0!
D) #ИМЯ?
13. Формула
в
Excel,
при
попытке
получить
корень
из
отрицательного числа, вернет в качестве своего результата ошибку …
A) #ЧИСЛО!
B) #ЗНАЧ!
C) #ДЕЛ/0!
D) #ИМЯ?
14. Среди перечисленных к реляционным СУБД, обрабатывающим
структурированные данные, относятся:
A) ORACLE
B) PostgreSQL
C) Redis
D) Memcached
15. Представление абстрактной информации в графической форме –
это …
A) авторизация данных
B) идентификация данных
C) визуализация данных
D) аутентификация данных
16. Объединение данных с целью анализа общей картины в целом,
сравнения компонентов, составляющих процент от некоего целого – это

A) распределение данных
B) авторизация данных

C) композиция данных
D) аутентификация данных
17. Объединяет линией набор точек, соответствующих значениям по
осям – …
A) линейный график
B) линейчатая диаграмма
C) пиктографическая диаграмма
D) круговая диаграмма
18. Использует значки, чтобы придать занимательный оттенок
обзору небольших наборов дискретных данных - …
A) линейный график
B) линейчатая диаграмма
C) пиктографическая диаграмма
D) круговая диаграмма
19. Использует декартовы координаты для отображения значений
двух переменных в виде точек на плоскости - …
A) линейный график
B) линейчатая диаграмма
C) пиктографическая диаграмма
D) диаграмма рассеивания
20.
Тип визуализации, в которой цвет выступает в качестве дополнительного
измерения, называется

A) цветная раскраска
B) тепловая карта
C) глубинная схема
D) диаграмма Ганта
21.
Тип визуализации, при котором происходит структуризация информации с
помощью пирамид, деревьев и карт, – это …
A) метафорическая визуализация
B) стратегическая визуализация
C) пирамидальная визуализация
D) схематичная визуализация
22.
Способ визуального представления данных при помощи точек для
представления вершин и отрезков (или ломаных) для отображения рёбер между
связанными вершинами – это …
A) граф
B) схема
C) график
D) пузырьковая диаграмма
23.
Методами визуализации многомерных наблюдений с произвольным числом
измерений являются:
A) лепестковая диаграмма
B) линейный график
C) пиктограмма «Лица Чернова»
D) круговая диаграмма
24.
Характеристиками центральной тенденции статистических параметров
распределения данных являются:
A) среднее значение (Mean)
B) мода (Mo)
C) медиана (Me)
D) межквартильный размах (IQR)


25.
Срединное значение вариационного ряда – это …
A) среднее значение
B) медиана
C) мода
D) дисперсия
26.
Значение переменной, которое чаще других встречается в выборке, – это …
A) среднее значение
B) медиана
C) мода
D) дисперсия
27.
Разность между наибольшим и наименьшим элементами выборки – это …
A) дисперсия
B) размах
C) стандартное отклонение
D) вариация
28.
Разделяет вариационный ряд пополам (50 % элементов меньше этого
значения и 50 % – больше) …
A) первый квартиль
B) третий квартиль
C) медиана
D) мода
29.
Разделяет вариационный ряд пополам (50 % элементов меньше этого
значения и 50 % – больше) …
A) первый квартиль
B) второй квартиль
C) третий квартиль
D) мода
30.
Разбивают вариационный ряд на четыре части (по 25% в каждой части) …
A) квартили
B) медианы
C) моды
D) дисперсии
31.
Число, разделяющее вариационный ряд на две части (25 % элементов
меньше этого значения, а 75 % – больше) – это …
A) первый квартиль
B) второй квартиль
C) третий квартиль
D) четвертый квартиль
32.
Число, разделяющее вариационный ряд на две части (75 % элементов
меньше этого значения, а 25 % – больше) – это …
A) первый квартиль
B) второй квартиль
C) третий квартиль
D) четвертый квартиль
33.
Разница между третьим и первым квартилем, характеризующая разброс
данных – это …
A) межквартильная дисперсия
B) межквартильный размах
C) стандартное отклонение
D) межквартильная вариация
34.
Устойчивыми к выбросам показателями являются:

A) медиана
B) среднее арифметическое
C) межквартильный размах
D) размах
35.
Метод визуализации данных, позволяющий определить степень разброса
(дисперсии) и асимметрии данных, – это …
A) коробчатая диаграмма
B) круговая диаграмма
C) пузырьковая диаграмма
D) лепестковая диаграмма
36.
Среднее арифметическое квадратов отклонений значений от их среднего –
это …
A) дисперсия
B) вариация
C) среднее значение
D) размах
37.
Форма распределения данных, когда среднее значение и медиана
совпадают, – это …
A) симметричное распределение
B) отрицательная асимметрия
C) положительная асимметрия
D) ассиметричное распределение
38.
Форма распределения данных, когда медиана больше среднего значения, –
это …
A) симметричное распределение
B) отрицательная асимметрия
C) положительная асимметрия
D) нулевая асимметрия
39.
Форма распределения данных, когда медиана меньше среднего значения, –
это …
A) симметричное распределение
B) отрицательная асимметрия
C) положительная асимметрия
D) нулевая асимметрия
40.
Упорядоченные данные, расположенные в порядке возрастания значения
переменной, либо в порядке убывания называют … рядом.
A) вариационным
B) числовым
C) категориальным
D) статистическим
41.
Применение некоторой функции к каждой точке в наборе данных в целях
уменьшения разброса значений и облегчения интерпретации и визуализации данных
– это …
A) преобразование данных
B) заполнение пропусков в данных
C) очистка данных
D) шифрование данных
42.
Функциями преобразования, часто применяемыми для визуализации
данных с большим разбросом положительных значений, являются:
A) логарифмирование
B) умножение на коэффициент
C) возведение в степень