Файл: Практическая работа 1 5 Задание 1 5 Практическая работа 2 9 Задание 1 9 Практическая работа 3 11 Задание 1 11 Вывод 16.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.02.2024
Просмотров: 18
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА»
Институт непрерывного образования
Практические занятия
По дисциплине «Технологии обработки информации»
Фамилия: Саидов
Имя: Умарбек
Отчество: Эркин Угли
№ зачетной книжки: 1910430
Группа №: ИБ-94з
Санкт-Петербург
2021
Оглавление
Введение 3
Практическая работа №1 5
Задание 1 5
Практическая работа №2 9
Задание 1 9
Практическая работа №3 11
Задание 1 11
Вывод 16
Введение
Цель практических занятий: познакомиться с R и RStudio, которые мы будем использовать на протяжении всех практических занятий, изучить статистические понятия, рассмотренные в лекциях, а также научиться анализировать реальные данные и делать обоснованные выводы.
Цель настоящего пособия состоит в том, чтобы познакомить студентов с основами использования современных сред обработки информации и разработки веб приложений. Язык R и среда RStudio первоначально являвшимися основным средством статистической обработки, постепенно завоевывают прочное место среди ИТ-специалистов, занимающихся всесторонним анализом данных и разработкой интерактивных информационных систем. В частности, систем, ориентированных на веб технологии использующие реактивные объекты.
Основная задача пособия заключается в развитии у студентов практических навыков использования эффективных программных пакетов обработки данных и разработки интерактивных веб приложений, удовлетворяющих самым высоким требованиям сегодняшнего дня. В этой связи представленные материалы отражают последние достижения в указанной сфере. Такие программные пакеты, как Shiny и knitr являются высокоэффективными средствами, обеспечивающими технологии создания информационных веб приложений на базе реактивных выражений.
Пособие включает необходимый методический материал для подготовки к практическим занятиям, а также контрольные задания для закрепления изученного материала. Для успешного выполнения контрольных заданий рекомендуется по мере знакомства с материалом выполнять описываемые команды и анализировать результаты их выполнения. Команды выделены в тексте следующим образом:
> команда
Пособие включает три основных раздела. В первом разделе описывается среда разработки RStudio.
Второй раздел посвящен описанию использования популярных технологий data mining для обработки различных информационных ресурсов с целью поиска, выделения и визуализации данных.
Наконец, третий раздел описывает технологии создания интерактивных веб приложений, в частности на базе реактивных выражений.
Контрольные задания размещены в конце основных разделов пособия и содержат ссылки на ресурсы интернета, которые необходимы для их выполнения.
Практическая работа №1
СРЕДА РАЗРАБОТКИ RSTUDIO
Задание 1
Используя фрейм present, создайте график доли мальчиков с течением времени, и на основе графика определите, является ли следующее утверждение истинным или ложным: доля мальчиков, родившихся в США, уменьшилась с течением времени.
Для начала введем с в командную строку R команду:
> source("http://www.openintro.org/stat/data/present.R")
В консоли это выглядит следующим образом (рис. 1):
Рисунок 1
Данные сохраняются во фрейме данных под названием present.
Эта команда инструктирует R получить доступ к сайту OpenIntro и принести данные: количество мальчиков и девочек, родившихся в каждый год в США.
В рабочей зоне в правом верхнем углу окна RStudio теперь отображается набор данных с именем present (рис. 2), в котором 63 строки (observations) на 3 столбца (variables).
Рисунок 2
При нажатии на present можно открыть вкладку с отображением данных фрейма (рис. 3):
Рисунок 3
Мы видим четыре колонки чисел, каждая строка которых представляет определенный год: первый элемент в каждой строке – номер строки, вторым элементом является год, а третий и четвертый – количество рожденных в этом году мальчиков и девочек, соответственно.
Обратим внимание, что номера строк в первом столбце не являются частью настоящего массива данных. R добавляет их, чтобы помочь сделать визуальное сравнение. Можно рассматривать их как индекс.
Исходя из задания, найдем долю новорожденных мальчиков по команде:
> present$boys/(present$boys + present$girls)
В консоли это выглядит следующим образом (рис. 4):
Рисунок 4
Затем построим необходимый график по команде:
> plot(x = present$year, y = present$boys/(present$boys + present$girls), type = "l")
В консоли это выглядит следующим образом (рис. 5):
Рисунок 5
График будет отражён в правом нижнем углу во вкладке «Plots» (рис. 6):
Рисунок 6
Далее на основе графика определим, является ли следующее утверждение истинным или ложным: доля мальчиков, родившихся в США, уменьшилась с течением времени.
По графику видно, что доля мальчиков уменьшилась с течением времени.
Это значит, что утверждение: доля мальчиков, родившихся в США, уменьшилась с течением времени – верно.
Практическая работа №2
ОБРАБОТКА ИНФОРМАЦИИ
Задание 1
Исходные данные American Community Survey предоставляет для скачивания данные, взятые из материалов различных обследований в Соединенных Штатах. Скачайте данные из опроса о жилье в штате Айдахо в 2006 г. с сайта: https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Fss06hid.csvЗагрузите эти данные в RStudio с помощью команды read.csv(). Книга кодирования, описывающая термины используемых в таблице переменных находится на: https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FPUMSDataDict06.pdf Задача Используя исходные данные определите общее количество предложений недвижимости с кодом расположения PUMA = 800 (Public Use Microdata Area code). Ответ Укажите правильный ответ: (231 1077 851 104)
Первым делом скачаем необходимый файл и считаем его по команде:
> data_1 = read.csv(file = 'C:\\Новая папка (3)\\new_data.csv', header = TRUE,sep = ",")
В консоли это выглядит следующим образом (рис. 7):
Рисунок 7
С помощью команды: > view(data_1) откроем вкладку с отображением данных фрейма и получим (рис. 8):
Рисунок 8
Далее создадим вектор, который просмотрит колонку PUMA и примет значение TRUE или FALSE, в зависимости от того какое значение в ячейке. По условию значение PUMA = 800.
> AT=data_1$PUMA==800
Считываем требуемое количество строк с TRUE по этому вектору.
> nrow(data_1[AT,])
Считываем информацию и выводим результат = 851.
В консоли это выглядит следующим образом (рис. 9:
Рисунок 9
851 строка удовлетворяет нашему условию.
Практическая работа №3
РАЗРАБОТКА ВЕБ-ПРИЛОЖЕНИЙ
Задание 1
Создайте веб презентацию, включающую три слайда следующего типа:
• Example (титульный слайд с названием презентации).
• Slide With Code (с примером R кода).
• Slide With Plot (с примером графика).
В качестве R кода возьмите пример из раздела «Фреймы», а в качестве графика пример из раздела «Интерфейс среды разработки».
Первым делом откроем R presentation. По умолчанию создано четыре слайда. Нам требуется создать презентацию из трех слайдов, поэтому один слайд удалим.
Переименуем первый титульный слайд на Example. Введем данные: имя, фамилию и дату. Код имеет вид:
Example
========================================================
author: Umarbek Saidov
date: 10.12.2021
autosize: true
Рисунок 10
Первый слайд выглядит следующим образом (рис. 11):
Рисунок 11
Затем переименуем второй слайд на Slide With Code. Введем данные примера из раздела «Фреймы». Код имеет вид:
Slide With Code
========================================================
```{r}
a = c(1, 2, 3)
b = c("x", "y", "z")
c = c(FALSE, TRUE, FALSE)
df = data.frame(a, b, c)
df
```
Рисунок 12
Второй слайд выглядит следующим образом (рис. 13):
Рисунок 13
Далее переименуем третий слайд на Slide With Plot. Введем данные примера из раздела «Интерфейс среды разработки». Код имеет вид:
Slide With Plot
========================================================
```{r, echo=FALSE}
source('http://www.openintro.org/stat/data/present.R')
plot(x = present$year, y = present$boys/(present$boys + present$girls), type = 'l')
```
Рисунок 14
Третий слайд выглядит следующим образом (рис. 15):
Рисунок 15
Вывод
В ходе практических занятий мы познакомились с R и RStudio, изучили статистические понятия, рассмотренные в лекциях, а также научились анализировать реальные данные и делать обоснованные выводы.