Общее
ОБЪЕМ ДИСЦИПЛИНЫ
Общий объем дисциплины составляет 3 зачетных единиц (з.е.), 108 академических часа.
Виды учебной работы
Объем в часах по семестрам
Всего
5
семестр
__
семестр
1. Контактная работа обучающихся с преподавателем по видам учебных занятий (всего)
108
Аудиторная работа (всего)
68
68
· Лекции (Л)
34
34
· семинары (С)
· лабораторные работы (ЛР)
34
34
2. Самостоятельная работа обучающихся (СР) (всего)
40
40
· Проработка учебного материала лекций
8
8
· Подготовка к семинарам
· Подготовка к лабораторным работам
11
11
· Подготовка к рубежному контролю, контрольной работе
6
6
· Подготовка докладов, рефератов, презентации
· Выполнение домашнего задания
· Выполнение курсового проекта / курсовой работы
· Подготовка к зачету
15
15
· Другие, отдельные виды СРС по Положению «Об организации внеаудиторной самостоятельной работы студентов МГТУ им. Н.Э. Баумана»
Вид промежуточной аттестации обучающегося
зачет
зачет
Содержание дисциплины, структурированное по модулям.
Модуль 1 . Средства визуализации данных. (18 часов)
Лекции по модулю 1. Содержание. Объем часов:
Лекция1.
Введение. Цели и задачи визуализации. Существующие средства визуализации аналитические платформы Pentaho BI Suite, Jaspersoft., QlikView, Deductor.
( 2 часа)
Лекция2.
Аналитическая платформа QlikView. Структура, основные компоненты, поддерживаемые аналитические технологии.
Аналитическая платформа Deductor. Структура, основные компоненты, поддерживаемые аналитические технологии
(2 часа)
Лекция3.
Методы визуализации. Методы геометрических преобразований. Отображение иконок. Методы, ориентированные на пикселы. Иерархические образы
(2 часа)
Лекция 4.
Визуализации на разных этапах –аналитического процесса, источников данных, загруженных в аналитическое приложение. Визуализация результатов анализа
(2 часа)
Лекция 5.
Источники данных. Классификация типов источников данных. Предназначение, структура и свойства OLTP систем.
Визуализаторы общего назначения- графики, диаграммы, гистограммы. OLAP анализ – манипуляция с измерениями, транспонирвание, детализация
(2 часа)
Лекция 6.
Визуализаторы для оценки для качества моделей. Матрица классификации. Диаграмма рассеяния. Визуализация контроля процесса обучения моделей
(2 часа)
Лекция 7.
Визуализаторы, применяемые для интерпретации результатов анализа. Древовидные визуализаторы. Визуализация связей. Карты
(2 часа)
Лекция 8.
Задачи решаемые ХД. Многомерные хранилища данных. Гибридные ХД. Витрины данных. Централизованное ХД с витринами данных. Виртуальные ХД
(2 часа)
Лекция 9..
Трансформация данных. Основные методы трансформации данных. Группировка данных. Разгруппировка данных. Слияние данных. Операции над таблицами: объединение, внутреннее соединение, внешнее соединение, полное внешнее соединение
(2 часа)
Семинары по модулю 1. Содержание. Объем часов
РПД не предусмотрены.
Лабораторные работы по модулю 1. Содержание. Объем часов:17
1. Освоить инструментарий ПО Pentaho Report Designer. Научиться добавлять источники данных. Освоить навык создания отчетов и диаграмм и провести анализ полученных результатов.
(4 часа)
2. Освоить объекты бизнес - аналитики BI QlickView». Освоить инструментарий. Запустить мастер построения диаграмм. Загрузить данные из Excel. Анализ результатов.
(4 часа)
3. Подключение к разным источникам данных. Выбор таблиц с необходимыми атрибутами. Отладка скриптов и датологической модели. Построение ассоциативной модели данных на базе BI QlickView.
(4 часа)
4. Визуализация данных на базе построенной ассоциативной модели в среде BI QlickView.
Построение таблиц, диаграмм и графиков по выбранным измерениям
(5 часов)
Самостоятельная работа (по видам самостоятельной работы). Объем часов:
Проработка разделов лекционного курса 4 .
Подготовка к лабораторным работам . 5,5
Подготовка к рубежному контролю, контрольной работе 3.
Модуль 2. Data Mining
(16 часов)
Лекции по модулю 2. Содержание. Объем часов:
Лекция 1.
Интеллектуальный анализ данных Data Mining. Задачи Data Mining: классификация, регрессия, ассоциативные правила, кластеризация.
(2 часа)
Лекция 2.
Модели Data Mining: описание и предсказание. Методы Data Mining: базовые методы, нечеткая логика, генетические алгоритмы, нейронные сети.
(2 часа)
Лекция 3.
Методы Data Mining – Базовые методы. Нечеткая логика
(2 часа)
Лекция 4.
Методы Data Mining – Генетические алгоритмы. Нейронные сети.
(2 часа)
Лекция 5.
Классификация. Постановка задачи. Правила классификации. Деревья решений. Методы построения правил классификации, деревьев решений.
Кластеризация. Постановка задачи. Меры близости основанные на расстояниях. Алгоритмы кластеризации
(2 часа)
Лекция 6.
Прогнозирование. Постановка задачи. Задачи прогнозирования. Методы и модели прогнозирования. Классификация методов прогнозирования. Аналитические методы прогнозирования. Статистические методы прогнозирования. Временные ряды
(2 часа)
Лекция 7
Введение в хранилище данных (ХД). Обзор архитектур ХД. Типовая структура хранилищ данных. Основные особенности концепции ХД. Основные требования к ХД. Основные концепции ХД
(2 часа)
Лекция 8. Основные способы реализации OLAP систем. MOLAP структура и основные свойства. ROLAP структура и основные свойства. HOLAP структура и основные свойства
(2 часа)
Семинары по модулю 2. Содержание. Объем часов
РПД не предусмотрены.
Лабораторные работы по модулю 2. Содержание. Объем часов: 16
1. Освоение инструментарии OLAP систем в среде «Статистика и Аналитика» МГТУ им. Баумана. Одновременно по нескольким измерениям формировать запрос с помощью конструктора в многомерный куб, формировать отчет, выгрузить и проводить анализ.
---- (4 часа)
2. Машинное обучение. Исследование и анализ точности распознавания символов с применением метода линейной регрессии.
(4 часа)
3. Машинное обучение. Исследование и анализ точности распознавания символов с применением метода логистической регрессий.
(4 часа)
4. Анализ временных рядов Анализ временных рядов при помощи многослойной нейронной сети.
(5 часа)