спасибо за помощь!
Подробнее о работе
Гарантия сервиса Автор24
Уникальность не ниже 50%
Курсовая работа выполняется в рамках образовательной программы «Информационные системы и технологии» («Интеллектуальные системы и технологии») и является неотъемлемой частью образовательного процесса. Выполнение курсовой работы представляет собой решение студентом, под руководством преподавателя, конкретных задач обработки информации.
Цель курсовой работы – углубить знания и умения студентов, полу-ченные в процессе теоретических и практических занятий, улучшить навы-ки самостоятельного поиска и изучения материала по теме курсовой рабо-ты, а также развить компетенции аналитической, исследовательской и про-ектной деятельности. В частности, компетенции:
- ПК-1 - способность проводить исследования на всех этапах жизнен-ного цикла программных средств;
- ПК-18 - способность выполнять работы по созданию (модифика-ции) и сопровождению ИС, автоматизирующих задачи организационного управления и бизнес-процессы;
- ПК-19 - способность выполнять работы и управлять работами по созданию (модификации) и сопровождению ИС, автоматизирующих зада-чи организационного управления и бизнес-процессы.
Содержание
Введение 3
Задание № 1: Понижение размерности данных 3
Загрузка и подготовка исходных данных для анализа 4
Главные теоретические положения 5
Решение поставленной задачи 6
Программный код 8
Заключение 9
Список использованных источников 10
Контрольные вопросы 10
Задание № 2: Кластеризация данных 14
Загрузка и подготовка исходных данных для анализа 15
Главные теоретические положения 16
Решение поставленной задачи 17
Программный код 19
Заключение 21
Список использованных источников 21
Контрольные вопросы 21
Задание № 3: Обработка графической информации 23
Подготовка исходных данных 23
Главные теоретические положения 24
Решение поставленной задачи 25
Программный код 27
Заключение 33
Список использованных источников 33
Контрольные вопросы 34
Выводы 35
КУРСОВАЯ РАБОТА
по дисциплине «Технологии обработки информации» СПбГУТ
Вариант 4
Содержание
Введение 3
Задание № 1: Понижение размерности данных 3
Загрузка и подготовка исходных данных для анализа 4
Главные теоретические положения 5
Решение поставленной задачи 6
Программный код 8
Заключение 9
Список использованных источников 10
Контрольные вопросы 10
Задание № 2: Кластеризация данных 14
Загрузка и подготовка исходных данных для анализа 15
Главные теоретические положения 16
Решение поставленной задачи 17
Программный код 19
Заключение 21
Список использованных источников 21
Контрольные вопросы 21
Задание № 3: Обработка графической информации 23
Подготовка исходных данных 23
Главные теоретические положения 24
Решение поставленной задачи 25
Программный код 27
Заключение 33
Список использованных источников 33
Контрольные вопросы 34
Выводы 35
Курсовая работа предполагает выполнение трех заданий.
Первое задание относится к изучению технологий понижения размерности анализируемых данных, позволяющих существенно снизить объем обрабатываемой информации. Для выполнения задания №1 следует изучить литературу, посвященную методу главных компонент, например [1-5] и ознакомиться с доступными библиотеками программ, реализующими данный метод.
Второе задание связано с использованием технологий, позволяющих
оценить возможности качественной кластеризации исследуемого набора данных. Современными эффективными алгоритмами, позволяющими решить подобную задачу, являются алгоритмы t-SNE и UMAP. Для выполнения задания
№2 следует изучить особенности реализации данных алгоритмов, например, с
использованием материалов ресурсов [6 – 10].
Третье задание позволить приобрести практические навыки в работе с
графической информацией на базе перспективной технологии SVG. Данная
технология тесно сопряжена с языком разметки HTML.
Первое и второе задание может выполняться в любой программной
среде, с использованием любых языков программирования и библиотек. Тем
не менее, рекомендуется использовать среду RStudio и язык программирования R, широко используемых IT-специалистами.
Задание № 1: Понижение размерности данных
Исследовать эффективность методов PCA и SVD для понижения размерности данных.
В качестве исходных данных для анализа следует самостоятельно выбрать изображение в формате jpg. Размер изображения должен быть не менее
400 х 400 пикселей.
В ходе исследования необходимо проделать следующее:
- выбрать и обосновать количество главных компонент, достаточное для качественной визуализации;
- оценить выигрыш сжатого изображения по объему, по сравнению
с оригиналом;
- оценить количество «утраченной» информации;
- выяснить зависит ли достаточное число компонент для качественной визуализации от характера изображения (если да, то оценить
эту зависимость).
Задание № 2: Кластеризация данных
Исследовать возможности классификации данных с использованием
алгоритмов t-SNE и UMAP.
Исходные данные для анализа загрузить из ресурса Wine Quality
(http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality /) репозитария [10]. Варианты заданий (номер варианта определяется последней цифрой номера зачетки) приведены в табл. 2.
Таблица 2
Варианты задания
Вариант Обучающая выборка
Четная цифра winequality-red.csv
Нечетная цифра winequality-white.csv
Анализируемые данные включают 11 объективных параметров различных сортов вина:
- фиксированная кислотность;
- летучая кислотность;
- лимонная кислота;
- остаточный сахар;
- хлориды;
- свободный диоксид серы;
- общий диоксид серы;
- плотность;
- pH;
- сульфаты;
- спирт.
Последний, 12-ый параметр является субъективной оценкой качества,
проставляемой экспертом и имеет несколько градаций.
Основная задача исследования состоит в определении качества субъективной оценки экспертов и формированию обоснованной кластеризации вин.
Исследование должно содержать:
- описание исследуемого набора данных,
- подготовку данных для анализа,
- план и решаемые задачи,
- выбор используемых функций и описание их параметров,
- результаты исследования,
- аргументированные выводы.
Программный код должен быть снабжен подробным комментарием.
Задание № 3: Обработка графической информации
Визуализировать отрывок сказки К.И.Чуковского «Муха-цокотуха» с
использованием технологии SVG, соответствующий номеру фрагмента. Номер своего фрагмента определяется последней цифрой номера зачетной
книжки:
Курсовая работа предполагает выполнение трех заданий.
Первое задание относится к изучению технологий понижения размерности анализируемых данных, позволяющих существенно снизить объем обрабатываемой информации. Для выполнения задания №1 следует изучить литературу, посвященную методу главных компонент, например [1-5] и ознакомиться с доступными библиотеками программ, реализующими данный метод.
Второе задание связано с использованием технологий, позволяющих
оценить возможности качественной кластеризации исследуемого набора данных. Современными эффективными алгоритмами, позволяющими решить подобную задачу, являются алгоритмы t-SNE и UMAP. Для выполнения задания
№2 следует изучить особенности реализации данных алгоритмов, например, с
использованием материалов ресурсов [6 – 10].
Третье задание позволить приобрести практические навыки в работе с
графической информацией на базе перспективной технологии SVG. Данная
технология тесно сопряжена с языком разметки HTML.
Первое и второе задание может выполняться в любой программной
среде, с использованием любых языков программирования и библиотек. Тем
не менее, рекомендуется использовать среду RStudio и язык программирования R, широко используемых IT-специалистами.
Задание № 1: Понижение размерности данных
Исследовать эффективность методов PCA и SVD для понижения размерности данных.
В качестве исходных данных для анализа следует самостоятельно выбрать изображение в формате jpg. Размер изображения должен быть не менее
400 х 400 пикселей.
В ходе исследования необходимо проделать следующее:
- выбрать и обосновать количество главных компонент, достаточное для качественной визуализации;
- оценить выигрыш сжатого изображения по объему, по сравнению
с оригиналом;
- оценить количество «утраченной» информации;
- выяснить зависит ли достаточное число компонент для качественной визуализации от характера изображения (если да, то оценить
эту зависимость).
Задание № 2: Кластеризация данных
Исследовать возможности классификации данных с использованием
алгоритмов t-SNE и UMAP.
Исходные данные для анализа загрузить из ресурса Wine Quality
(http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality /) репозитария [10]. Варианты заданий (номер варианта определяется последней цифрой номера зачетки) приведены в табл. 2.
Таблица 2
Варианты задания
Вариант Обучающая выборка
Четная цифра winequality-red.csv
Нечетная цифра winequality-white.csv
Анализируемые данные включают 11 объективных параметров различных сортов вина:
- фиксированная кислотность;
- летучая кислотность;
- лимонная кислота;
- остаточный сахар;
- хлориды;
- свободный диоксид серы;
- общий диоксид серы;
- плотность;
- pH;
- сульфаты;
- спирт.
Последний, 12-ый параметр является субъективной оценкой качества,
проставляемой экспертом и имеет несколько градаций.
Основная задача исследования состоит в определении качества субъективной оценки экспертов и формированию обоснованной кластеризации вин.
Исследование должно содержать:
- описание исследуемого набора данных,
- подготовку данных для анализа,
- план и решаемые задачи,
- выбор используемых функций и описание их параметров,
- результаты исследования,
- аргументированные выводы.
Программный код должен быть снабжен подробным комментарием.
Задание № 3: Обработка графической информации
Визуализировать отрывок сказки К.И.Чуковского «Муха-цокотуха» с
использованием технологии SVG, соответствующий номеру фрагмента. Номер своего фрагмента определяется последней цифрой номера зачетной
книжки:
Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям
Курсовая работа выполняется в рамках образовательной программы «Информационные системы и технологии» («Интеллектуальные системы и технологии») и является неотъемлемой частью образовательного процесса. Выполнение курсовой работы представляет собой решение студентом, под руководством преподавателя, конкретных задач обработки информации.
Цель курсовой работы – углубить знания и умения студентов, полу-ченные в процессе теоретических и практических занятий, улучшить навы-ки самостоятельного поиска и изучения материала по теме курсовой рабо-ты, а также развить компетенции аналитической, исследовательской и про-ектной деятельности. В частности, компетенции:
- ПК-1 - способность проводить исследования на всех этапах жизнен-ного цикла программных средств;
- ПК-18 - способность выполнять работы по созданию (модифика-ции) и сопровождению ИС, автоматизирующих задачи организационного управления и бизнес-процессы;
- ПК-19 - способность выполнять работы и управлять работами по созданию (модификации) и сопровождению ИС, автоматизирующих зада-чи организационного управления и бизнес-процессы.
Содержание
Введение 3
Задание № 1: Понижение размерности данных 3
Загрузка и подготовка исходных данных для анализа 4
Главные теоретические положения 5
Решение поставленной задачи 6
Программный код 8
Заключение 9
Список использованных источников 10
Контрольные вопросы 10
Задание № 2: Кластеризация данных 14
Загрузка и подготовка исходных данных для анализа 15
Главные теоретические положения 16
Решение поставленной задачи 17
Программный код 19
Заключение 21
Список использованных источников 21
Контрольные вопросы 21
Задание № 3: Обработка графической информации 23
Подготовка исходных данных 23
Главные теоретические положения 24
Решение поставленной задачи 25
Программный код 27
Заключение 33
Список использованных источников 33
Контрольные вопросы 34
Выводы 35
КУРСОВАЯ РАБОТА
по дисциплине «Технологии обработки информации» СПбГУТ
Вариант 4
Содержание
Введение 3
Задание № 1: Понижение размерности данных 3
Загрузка и подготовка исходных данных для анализа 4
Главные теоретические положения 5
Решение поставленной задачи 6
Программный код 8
Заключение 9
Список использованных источников 10
Контрольные вопросы 10
Задание № 2: Кластеризация данных 14
Загрузка и подготовка исходных данных для анализа 15
Главные теоретические положения 16
Решение поставленной задачи 17
Программный код 19
Заключение 21
Список использованных источников 21
Контрольные вопросы 21
Задание № 3: Обработка графической информации 23
Подготовка исходных данных 23
Главные теоретические положения 24
Решение поставленной задачи 25
Программный код 27
Заключение 33
Список использованных источников 33
Контрольные вопросы 34
Выводы 35
Курсовая работа предполагает выполнение трех заданий.
Первое задание относится к изучению технологий понижения размерности анализируемых данных, позволяющих существенно снизить объем обрабатываемой информации. Для выполнения задания №1 следует изучить литературу, посвященную методу главных компонент, например [1-5] и ознакомиться с доступными библиотеками программ, реализующими данный метод.
Второе задание связано с использованием технологий, позволяющих
оценить возможности качественной кластеризации исследуемого набора данных. Современными эффективными алгоритмами, позволяющими решить подобную задачу, являются алгоритмы t-SNE и UMAP. Для выполнения задания
№2 следует изучить особенности реализации данных алгоритмов, например, с
использованием материалов ресурсов [6 – 10].
Третье задание позволить приобрести практические навыки в работе с
графической информацией на базе перспективной технологии SVG. Данная
технология тесно сопряжена с языком разметки HTML.
Первое и второе задание может выполняться в любой программной
среде, с использованием любых языков программирования и библиотек. Тем
не менее, рекомендуется использовать среду RStudio и язык программирования R, широко используемых IT-специалистами.
Задание № 1: Понижение размерности данных
Исследовать эффективность методов PCA и SVD для понижения размерности данных.
В качестве исходных данных для анализа следует самостоятельно выбрать изображение в формате jpg. Размер изображения должен быть не менее
400 х 400 пикселей.
В ходе исследования необходимо проделать следующее:
- выбрать и обосновать количество главных компонент, достаточное для качественной визуализации;
- оценить выигрыш сжатого изображения по объему, по сравнению
с оригиналом;
- оценить количество «утраченной» информации;
- выяснить зависит ли достаточное число компонент для качественной визуализации от характера изображения (если да, то оценить
эту зависимость).
Задание № 2: Кластеризация данных
Исследовать возможности классификации данных с использованием
алгоритмов t-SNE и UMAP.
Исходные данные для анализа загрузить из ресурса Wine Quality
(http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality /) репозитария [10]. Варианты заданий (номер варианта определяется последней цифрой номера зачетки) приведены в табл. 2.
Таблица 2
Варианты задания
Вариант Обучающая выборка
Четная цифра winequality-red.csv
Нечетная цифра winequality-white.csv
Анализируемые данные включают 11 объективных параметров различных сортов вина:
- фиксированная кислотность;
- летучая кислотность;
- лимонная кислота;
- остаточный сахар;
- хлориды;
- свободный диоксид серы;
- общий диоксид серы;
- плотность;
- pH;
- сульфаты;
- спирт.
Последний, 12-ый параметр является субъективной оценкой качества,
проставляемой экспертом и имеет несколько градаций.
Основная задача исследования состоит в определении качества субъективной оценки экспертов и формированию обоснованной кластеризации вин.
Исследование должно содержать:
- описание исследуемого набора данных,
- подготовку данных для анализа,
- план и решаемые задачи,
- выбор используемых функций и описание их параметров,
- результаты исследования,
- аргументированные выводы.
Программный код должен быть снабжен подробным комментарием.
Задание № 3: Обработка графической информации
Визуализировать отрывок сказки К.И.Чуковского «Муха-цокотуха» с
использованием технологии SVG, соответствующий номеру фрагмента. Номер своего фрагмента определяется последней цифрой номера зачетной
книжки:
Курсовая работа предполагает выполнение трех заданий.
Первое задание относится к изучению технологий понижения размерности анализируемых данных, позволяющих существенно снизить объем обрабатываемой информации. Для выполнения задания №1 следует изучить литературу, посвященную методу главных компонент, например [1-5] и ознакомиться с доступными библиотеками программ, реализующими данный метод.
Второе задание связано с использованием технологий, позволяющих
оценить возможности качественной кластеризации исследуемого набора данных. Современными эффективными алгоритмами, позволяющими решить подобную задачу, являются алгоритмы t-SNE и UMAP. Для выполнения задания
№2 следует изучить особенности реализации данных алгоритмов, например, с
использованием материалов ресурсов [6 – 10].
Третье задание позволить приобрести практические навыки в работе с
графической информацией на базе перспективной технологии SVG. Данная
технология тесно сопряжена с языком разметки HTML.
Первое и второе задание может выполняться в любой программной
среде, с использованием любых языков программирования и библиотек. Тем
не менее, рекомендуется использовать среду RStudio и язык программирования R, широко используемых IT-специалистами.
Задание № 1: Понижение размерности данных
Исследовать эффективность методов PCA и SVD для понижения размерности данных.
В качестве исходных данных для анализа следует самостоятельно выбрать изображение в формате jpg. Размер изображения должен быть не менее
400 х 400 пикселей.
В ходе исследования необходимо проделать следующее:
- выбрать и обосновать количество главных компонент, достаточное для качественной визуализации;
- оценить выигрыш сжатого изображения по объему, по сравнению
с оригиналом;
- оценить количество «утраченной» информации;
- выяснить зависит ли достаточное число компонент для качественной визуализации от характера изображения (если да, то оценить
эту зависимость).
Задание № 2: Кластеризация данных
Исследовать возможности классификации данных с использованием
алгоритмов t-SNE и UMAP.
Исходные данные для анализа загрузить из ресурса Wine Quality
(http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality /) репозитария [10]. Варианты заданий (номер варианта определяется последней цифрой номера зачетки) приведены в табл. 2.
Таблица 2
Варианты задания
Вариант Обучающая выборка
Четная цифра winequality-red.csv
Нечетная цифра winequality-white.csv
Анализируемые данные включают 11 объективных параметров различных сортов вина:
- фиксированная кислотность;
- летучая кислотность;
- лимонная кислота;
- остаточный сахар;
- хлориды;
- свободный диоксид серы;
- общий диоксид серы;
- плотность;
- pH;
- сульфаты;
- спирт.
Последний, 12-ый параметр является субъективной оценкой качества,
проставляемой экспертом и имеет несколько градаций.
Основная задача исследования состоит в определении качества субъективной оценки экспертов и формированию обоснованной кластеризации вин.
Исследование должно содержать:
- описание исследуемого набора данных,
- подготовку данных для анализа,
- план и решаемые задачи,
- выбор используемых функций и описание их параметров,
- результаты исследования,
- аргументированные выводы.
Программный код должен быть снабжен подробным комментарием.
Задание № 3: Обработка графической информации
Визуализировать отрывок сказки К.И.Чуковского «Муха-цокотуха» с
использованием технологии SVG, соответствующий номеру фрагмента. Номер своего фрагмента определяется последней цифрой номера зачетной
книжки:
Купить эту работу vs Заказать новую | ||
---|---|---|
11 раз | Куплено | Выполняется индивидуально |
Не менее 40%
Исполнитель, загружая работу в «Банк готовых работ» подтверждает, что
уровень оригинальности
работы составляет не менее 40%
|
Уникальность | Выполняется индивидуально |
Сразу в личном кабинете | Доступность | Срок 1—6 дней |
1200 ₽ | Цена | от 500 ₽ |
Не подошла эта работа?
В нашей базе 149278 Курсовых работ — поможем найти подходящую