Файл: Практическая работа 1 5 Задание 1 5 Практическая работа 2 9 Задание 1 9 Практическая работа 3 11 Задание 1 11 Вывод 16.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.02.2024

Просмотров: 20

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ

УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА»

Институт непрерывного образования

Практические занятия

По дисциплине «Технологии обработки информации»

Фамилия: Саидов

Имя: Умарбек

Отчество: Эркин Угли

№ зачетной книжки: 1910430

Группа №: ИБ-94з

Санкт-Петербург

2021

Оглавление


Введение 3

Практическая работа №1 5

Задание 1 5

Практическая работа №2 9

Задание 1 9

Практическая работа №3 11

Задание 1 11

Вывод 16


Введение


Цель практических занятий: познакомиться с R и RStudio, которые мы будем использовать на протяжении всех практических занятий, изучить статистические понятия, рассмотренные в лекциях, а также научиться анализировать реальные данные и делать обоснованные выводы.

Цель настоящего пособия состоит в том, чтобы познакомить студентов с основами использования современных сред обработки информации и разработки веб приложений. Язык R и среда RStudio первоначально являвшимися основным средством статистической обработки, постепенно завоевывают прочное место среди ИТ-специалистов, занимающихся всесторонним анализом данных и разработкой интерактивных информационных систем. В частности, систем, ориентированных на веб технологии использующие реактивные объекты.

Основная задача пособия заключается в развитии у студентов практических навыков использования эффективных программных пакетов обработки данных и разработки интерактивных веб приложений, удовлетворяющих самым высоким требованиям сегодняшнего дня. В этой связи представленные материалы отражают последние достижения в указанной сфере. Такие программные пакеты, как Shiny и knitr являются высокоэффективными средствами, обеспечивающими технологии создания информационных веб приложений на базе реактивных выражений.

Пособие включает необходимый методический материал для подготовки к практическим занятиям, а также контрольные задания для закрепления изученного материала. Для успешного выполнения контрольных заданий рекомендуется по мере знакомства с материалом выполнять описываемые команды и анализировать результаты их выполнения. Команды выделены в тексте следующим образом:


> команда

Пособие включает три основных раздела. В первом разделе описывается среда разработки RStudio.

Второй раздел посвящен описанию использования популярных технологий data mining для обработки различных информационных ресурсов с целью поиска, выделения и визуализации данных.

Наконец, третий раздел описывает технологии создания интерактивных веб приложений, в частности на базе реактивных выражений.

Контрольные задания размещены в конце основных разделов пособия и содержат ссылки на ресурсы интернета, которые необходимы для их выполнения.

Практическая работа №1


СРЕДА РАЗРАБОТКИ RSTUDIO

Задание 1


Используя фрейм present, создайте график доли мальчиков с течением времени, и на основе графика определите, является ли следующее утверждение истинным или ложным: доля мальчиков, родившихся в США, уменьшилась с течением времени.

Для начала введем с в командную строку R команду:

> source("http://www.openintro.org/stat/data/present.R")

В консоли это выглядит следующим образом (рис. 1):



Рисунок 1

Данные сохраняются во фрейме данных под названием present.

Эта команда инструктирует R получить доступ к сайту OpenIntro и принести данные: количество мальчиков и девочек, родившихся в каждый год в США.

В рабочей зоне в правом верхнем углу окна RStudio теперь отображается набор данных с именем present (рис. 2), в котором 63 строки (observations) на 3 столбца (variables).



Рисунок 2

При нажатии на present можно открыть вкладку с отображением данных фрейма (рис. 3):



Рисунок 3

Мы видим четыре колонки чисел, каждая строка которых представляет определенный год: первый элемент в каждой строке – номер строки, вторым элементом является год, а третий и четвертый – количество рожденных в этом году мальчиков и девочек, соответственно.



Обратим внимание, что номера строк в первом столбце не являются частью настоящего массива данных. R добавляет их, чтобы помочь сделать визуальное сравнение. Можно рассматривать их как индекс.

Исходя из задания, найдем долю новорожденных мальчиков по команде:

> present$boys/(present$boys + present$girls)

В консоли это выглядит следующим образом (рис. 4):



Рисунок 4

Затем построим необходимый график по команде:

> plot(x = present$year, y = present$boys/(present$boys + present$girls), type = "l")

В консоли это выглядит следующим образом (рис. 5):



Рисунок 5

График будет отражён в правом нижнем углу во вкладке «Plots» (рис. 6):



Рисунок 6

Далее на основе графика определим, является ли следующее утверждение истинным или ложным: доля мальчиков, родившихся в США, уменьшилась с течением времени.

По графику видно, что доля мальчиков уменьшилась с течением времени.

Это значит, что утверждение: доля мальчиков, родившихся в США, уменьшилась с течением времени – верно.

Практическая работа №2


ОБРАБОТКА ИНФОРМАЦИИ

Задание 1


Исходные данные American Community Survey предоставляет для скачивания данные, взятые из материалов различных обследований в Соединенных Штатах. Скачайте данные из опроса о жилье в штате Айдахо в 2006 г. с сайта: https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Fss06hid.csvЗагрузите эти данные в RStudio с помощью команды read.csv(). Книга кодирования, описывающая термины используемых в таблице переменных находится на: https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FPUMSDataDict06.pdf Задача Используя исходные данные определите общее количество предложений недвижимости с кодом расположения PUMA = 800 (Public Use Microdata Area code). Ответ Укажите правильный ответ: (231 1077 851 104)

Первым делом скачаем необходимый файл и считаем его по команде:

> data_1 = read.csv(file = 'C:\\Новая папка (3)\\new_data.csv', header = TRUE,sep = ",")

В консоли это выглядит следующим образом (рис. 7):



Рисунок 7

С помощью команды: > view(data_1) откроем вкладку с отображением данных фрейма и получим (рис. 8):



Рисунок 8


Далее создадим вектор, который просмотрит колонку PUMA и примет значение TRUE или FALSE, в зависимости от того какое значение в ячейке. По условию значение PUMA = 800.

> AT=data_1$PUMA==800

Считываем требуемое количество строк с TRUE по этому вектору.

> nrow(data_1[AT,])

Считываем информацию и выводим результат = 851.

В консоли это выглядит следующим образом (рис. 9:



Рисунок 9

851 строка удовлетворяет нашему условию.

Практическая работа №3


РАЗРАБОТКА ВЕБ-ПРИЛОЖЕНИЙ

Задание 1


Создайте веб презентацию, включающую три слайда следующего типа:

• Example (титульный слайд с названием презентации).

• Slide With Code (с примером R кода).

• Slide With Plot (с примером графика).

В качестве R кода возьмите пример из раздела «Фреймы», а в качестве графика пример из раздела «Интерфейс среды разработки».

Первым делом откроем R presentation. По умолчанию создано четыре слайда. Нам требуется создать презентацию из трех слайдов, поэтому один слайд удалим.

Переименуем первый титульный слайд на Example. Введем данные: имя, фамилию и дату. Код имеет вид:

Example

========================================================

author: Umarbek Saidov

date: 10.12.2021

autosize: true


Рисунок 10

Первый слайд выглядит следующим образом (рис. 11):



Рисунок 11

Затем переименуем второй слайд на Slide With Code. Введем данные примера из раздела «Фреймы». Код имеет вид:

Slide With Code

========================================================

```{r}

a = c(1, 2, 3)

b = c("x", "y", "z")

c = c(FALSE, TRUE, FALSE)

df = data.frame(a, b, c)

df

```


Рисунок 12

Второй слайд выглядит следующим образом (рис. 13):



Рисунок 13

Далее переименуем третий слайд на Slide With Plot. Введем данные примера из раздела «Интерфейс среды разработки». Код имеет вид:

Slide With Plot

========================================================

```{r, echo=FALSE}

source('http://www.openintro.org/stat/data/present.R')

plot(x = present$year, y = present$boys/(present$boys + present$girls), type = 'l')

```



Рисунок 14

Третий слайд выглядит следующим образом (рис. 15):




Рисунок 15


Вывод


В ходе практических занятий мы познакомились с R и RStudio, изучили статистические понятия, рассмотренные в лекциях, а также научились анализировать реальные данные и делать обоснованные выводы.