Автор24

Информация о работе

Подробнее о работе

Страница работы

Выбор числа кластеров на основе анализа последовательности итеративных аномальных кластеров Choosing the right number of clusters using the sequence o

  • 26 страниц
  • 2021 год
  • 2 просмотра
  • 0 покупок
Автор работы

user2637281

кандидат наук, доцент

1550 ₽

Работа будет доступна в твоём личном кабинете после покупки

Гарантия сервиса Автор24

Уникальность не ниже 50%

Фрагменты работ

3 Введение

Кластеризация является одним из самых главных методов анализа данных, основная задача которого заключается в разбиении объектов на группы, называемые кластерами. Каждая группа должна содержать в себе "похожие" объекты, следовательно объекты разных групп должны быть как можно более разными, основываясь на их признаках. Основное различие между кластеризацией и классификацией заключается в том, что список групп четко не определен, данная задача решается в процессе работы алгоритма. Применение кластерного анализа в целом сводится к следующим этапам:
1 Выбор набора объектов для кластеризации.

2 Определение набора переменных, которые будут использоваться для оценки объектов в выборке. При необходимости значения переменных стандартизируются.

3 Расчет расстояний между объектами множества с использованием оптимальной метрики.

4 Использование метода кластерного анализа для создания групп похожих объектов (кластеров).

5Представление результатов анализа.

После получения и анализа результатов можно скорректировать

выбранную метрику и метод кластеризации для получения оптимального результата.

Для этой работы ключевым алгоритмом является K-means, популярный алгоритм кластеризации, основная суть которого заключается в итеративном пересчете центра масс для каждого кластера на каждом шаге, после чего объекты снова делятся на кластеры в соответствии с тем, какой из новых центров был ближе к обновленному центру. Однако количество кластеров не всегда известно заранее, поэтому некоторые алгоритмы кластеризации необходимо модифицировать для решения задач, в которых не указано количество кластеров, на которые должны быть разделены эти объекты.


Главной целью ВКР является реализация и оценка качества метода аномальных кластеров, который итеративно находит в исходном множестве кластеры, рассматривая удаленность объектов от опорной точки. Также были рассмотрены метод локтя, рассматривающий инерцию кластеров, diversity method, рассчитывающий для каждого числа кластеров энтропию, и метод I-nice.

В качестве результата данной работы представлена реализация методов выбора оптимального числа кластеров для улучшения алгоритма K-means и сравнение результатов их работы на реальных данных для оценки качества их работы.

Для реализации методов и алгоритмов использовался язык программирования Python 3.7 в среде Google Colaboratory.

Содержание




1 Аннотация ........................................................................................................... 3
2 Annotation ............................................................................................................ 4
3 Введение............................................................................................................... 5
4 Обзор литературы.............................................................................................. 7
5 Метод аномальных кластеров и Intelligent K-means ................................... 8
5.1 Метод аномальных кластеров .................................................................. 8
5.2 Intelligent K-means ....................................................................................... 9
6 Метод Локтя...................................................................................................... 11
7 Метод разнородности ...................................................................................... 13
8 Данные ............................................................................................................... 14
9 Оценка качества............................................................................................... 17
10 Результаты ..................................................................................................... 19
11 Заключение .................................................................................................... 21
11.1 Выводы........................................................................................................ 21
11.2 Дальнейшая работа................................................................................... 21
12 Список источников ...................................................................................... 23
13 Приложения................................................................................................... 24

Добрый день! Уважаемые студенты, Вашему вниманию представляется дипломная работа на тему: «Выбор числа кластеров на основе анализа последовательности итеративных аномальных кластеров Choosing the right number of clusters using the sequence of iterative anomalous clusters.»

1 Аннотация

Одной из главных проблем алгоритмов кластерного анализа является выбор числа кластеров, на которые будет разбиваться множество объектов. Данная работа посвящена изучению возможности использования для этой цели метода аномальных кластеров, который выводит центры аномальных кластеров

в качестве входных данных популярного алгоритма K-средних. Также в рамках проекта были рассмотрены прочие методы для определения оптимального числа кластеров и их сравнение с вышеупомянутым методом аномальных кластеров.


Ключевые слова — выбор числа кластеров, кластеризация, K-means, Аномальные кластеры

12 Список источников

[1] - Boris G Mirkin, 2019, Core Partitioning: K-means and Similarity Clustering, In book: Bondgraphen (pp.293-403).

[2] - Kingrani, Suneel Kumar and Levene, Mark and Zhang, Dell (2018) Estimating the number of clusters using diversity. Artificial Intelligence Research 7 (1), pp. 15-22. ISSN 1927-6974.

[3] - Md Abdul Masud, Joshua Zhexue Huang, Chenghao Wei, Jikui Wang, Imran Khan, Ming Zhong, 2018, I-nice: A new approach for identifying the number of clusters and initial cluster centres.

[4] - Yu-Lin He, Hong-Lian Qin, Joshua Zhexue Huang, Yi Jin, 2020, Novel electricity pattern identification system based on improved I-nice algorithm

[5] - Renato Cordeiro de Amorim, Vladimir Makarenkov, Boris Mirkin, 2016, A-Wardpβ: Effective hierarchical clustering using the Minkowski metric and a fast k-means initialisation

[6] - Yulin He, Yingyan Wu, Honglian Qin, Joshua Zhexue Huang, Yi Jin, 2020, Improved I-nice clustering algorithm based on density peaks mechanism

[7] - https://archive.ics.uci.edu/ml/index.php

[8] - https://www.kaggle.com/camnugent/california-housing-prices

Форма заказа новой работы

Не подошла эта работа?

Закажи новую работу, сделанную по твоим требованиям

Согласен с условиями политики конфиденциальности и  пользовательского соглашения

Фрагменты работ

3 Введение

Кластеризация является одним из самых главных методов анализа данных, основная задача которого заключается в разбиении объектов на группы, называемые кластерами. Каждая группа должна содержать в себе "похожие" объекты, следовательно объекты разных групп должны быть как можно более разными, основываясь на их признаках. Основное различие между кластеризацией и классификацией заключается в том, что список групп четко не определен, данная задача решается в процессе работы алгоритма. Применение кластерного анализа в целом сводится к следующим этапам:
1 Выбор набора объектов для кластеризации.

2 Определение набора переменных, которые будут использоваться для оценки объектов в выборке. При необходимости значения переменных стандартизируются.

3 Расчет расстояний между объектами множества с использованием оптимальной метрики.

4 Использование метода кластерного анализа для создания групп похожих объектов (кластеров).

5Представление результатов анализа.

После получения и анализа результатов можно скорректировать

выбранную метрику и метод кластеризации для получения оптимального результата.

Для этой работы ключевым алгоритмом является K-means, популярный алгоритм кластеризации, основная суть которого заключается в итеративном пересчете центра масс для каждого кластера на каждом шаге, после чего объекты снова делятся на кластеры в соответствии с тем, какой из новых центров был ближе к обновленному центру. Однако количество кластеров не всегда известно заранее, поэтому некоторые алгоритмы кластеризации необходимо модифицировать для решения задач, в которых не указано количество кластеров, на которые должны быть разделены эти объекты.


Главной целью ВКР является реализация и оценка качества метода аномальных кластеров, который итеративно находит в исходном множестве кластеры, рассматривая удаленность объектов от опорной точки. Также были рассмотрены метод локтя, рассматривающий инерцию кластеров, diversity method, рассчитывающий для каждого числа кластеров энтропию, и метод I-nice.

В качестве результата данной работы представлена реализация методов выбора оптимального числа кластеров для улучшения алгоритма K-means и сравнение результатов их работы на реальных данных для оценки качества их работы.

Для реализации методов и алгоритмов использовался язык программирования Python 3.7 в среде Google Colaboratory.

Содержание




1 Аннотация ........................................................................................................... 3
2 Annotation ............................................................................................................ 4
3 Введение............................................................................................................... 5
4 Обзор литературы.............................................................................................. 7
5 Метод аномальных кластеров и Intelligent K-means ................................... 8
5.1 Метод аномальных кластеров .................................................................. 8
5.2 Intelligent K-means ....................................................................................... 9
6 Метод Локтя...................................................................................................... 11
7 Метод разнородности ...................................................................................... 13
8 Данные ............................................................................................................... 14
9 Оценка качества............................................................................................... 17
10 Результаты ..................................................................................................... 19
11 Заключение .................................................................................................... 21
11.1 Выводы........................................................................................................ 21
11.2 Дальнейшая работа................................................................................... 21
12 Список источников ...................................................................................... 23
13 Приложения................................................................................................... 24

Добрый день! Уважаемые студенты, Вашему вниманию представляется дипломная работа на тему: «Выбор числа кластеров на основе анализа последовательности итеративных аномальных кластеров Choosing the right number of clusters using the sequence of iterative anomalous clusters.»

1 Аннотация

Одной из главных проблем алгоритмов кластерного анализа является выбор числа кластеров, на которые будет разбиваться множество объектов. Данная работа посвящена изучению возможности использования для этой цели метода аномальных кластеров, который выводит центры аномальных кластеров

в качестве входных данных популярного алгоритма K-средних. Также в рамках проекта были рассмотрены прочие методы для определения оптимального числа кластеров и их сравнение с вышеупомянутым методом аномальных кластеров.


Ключевые слова — выбор числа кластеров, кластеризация, K-means, Аномальные кластеры

12 Список источников

[1] - Boris G Mirkin, 2019, Core Partitioning: K-means and Similarity Clustering, In book: Bondgraphen (pp.293-403).

[2] - Kingrani, Suneel Kumar and Levene, Mark and Zhang, Dell (2018) Estimating the number of clusters using diversity. Artificial Intelligence Research 7 (1), pp. 15-22. ISSN 1927-6974.

[3] - Md Abdul Masud, Joshua Zhexue Huang, Chenghao Wei, Jikui Wang, Imran Khan, Ming Zhong, 2018, I-nice: A new approach for identifying the number of clusters and initial cluster centres.

[4] - Yu-Lin He, Hong-Lian Qin, Joshua Zhexue Huang, Yi Jin, 2020, Novel electricity pattern identification system based on improved I-nice algorithm

[5] - Renato Cordeiro de Amorim, Vladimir Makarenkov, Boris Mirkin, 2016, A-Wardpβ: Effective hierarchical clustering using the Minkowski metric and a fast k-means initialisation

[6] - Yulin He, Yingyan Wu, Honglian Qin, Joshua Zhexue Huang, Yi Jin, 2020, Improved I-nice clustering algorithm based on density peaks mechanism

[7] - https://archive.ics.uci.edu/ml/index.php

[8] - https://www.kaggle.com/camnugent/california-housing-prices

Купить эту работу

Выбор числа кластеров на основе анализа последовательности итеративных аномальных кластеров Choosing the right number of clusters using the sequence o

1550 ₽

или заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 3000 ₽

Гарантии Автор24

Изображения работ

Страница работы
Страница работы
Страница работы

Понравилась эта работа?

или

6 октября 2021 заказчик разместил работу

Выбранный эксперт:

Автор работы
user2637281
4.1
кандидат наук, доцент
Купить эту работу vs Заказать новую
0 раз Куплено Выполняется индивидуально
Не менее 40%
Исполнитель, загружая работу в «Банк готовых работ» подтверждает, что уровень оригинальности работы составляет не менее 40%
Уникальность Выполняется индивидуально
Сразу в личном кабинете Доступность Срок 1—6 дней
1550 ₽ Цена от 3000 ₽

5 Похожих работ

Дипломная работа

Диплом Информационная система контроля взаиморасчетов с поставщиками и потребителями

Уникальность: от 40%
Доступность: сразу
3000 ₽
Дипломная работа

Разработка модуля эффекта от проведения энергосберегающих ресурсов

Уникальность: от 40%
Доступность: сразу
2800 ₽
Дипломная работа

Разработка электронного образовательного ресурса Web 2.0 как средство коллективной работы

Уникальность: от 40%
Доступность: сразу
2800 ₽
Дипломная работа

Проектирование автоматизированной системы учета продукции

Уникальность: от 40%
Доступность: сразу
2800 ₽
Дипломная работа

Разработка прототипа автоматизированной системы для подготовки проведения семинаров

Уникальность: от 40%
Доступность: сразу
2800 ₽

Отзывы студентов

Отзыв punklexa об авторе user2637281 2019-07-09
Дипломная работа

Спасибо Вам за работу!

Общая оценка 5
Отзыв Женя13 об авторе user2637281 2016-02-26
Дипломная работа

Огромное спасибо! Дипломная работа сделана оперативно и качественно!!!

Общая оценка 5
Отзыв Талгат Талгат об авторе user2637281 2014-05-01
Дипломная работа

Автор мне очень понравился. Профессионал своего дела! Если сказал, что может сделать, то делает! Всегда находится на связи и не подводит по срокам!!! Очень приятно с ним сотрудничать!!! Желаю Вам дальнейших выгодных заказов и успехов!!! Спасибо!!!

Общая оценка 5
Отзыв Елена С. об авторе user2637281 2014-05-21
Дипломная работа

Честный и ответственный автор

Общая оценка 5

другие учебные работы по предмету

Готовая работа

разработка урока "Системы счисления"

Уникальность: от 40%
Доступность: сразу
200 ₽
Готовая работа

Packet Tracer.

Уникальность: от 40%
Доступность: сразу
490 ₽
Готовая работа

Формирование плана выпуска продукции.

Уникальность: от 40%
Доступность: сразу
490 ₽
Готовая работа

Транспортная логистика фирмы ООО "AZ"

Уникальность: от 40%
Доступность: сразу
490 ₽
Готовая работа

ФИЛЬТРАЦИЯ ДАННЫХ В ТАБЛИЧНОМ ПРОЦЕССОРЕ EXCEL

Уникальность: от 40%
Доступность: сразу
100 ₽
Готовая работа

исправить курсовую

Уникальность: от 40%
Доступность: сразу
660 ₽
Готовая работа

Методика разработки сетевого проекта по Информатике

Уникальность: от 40%
Доступность: сразу
734 ₽
Готовая работа

бинарное дерево

Уникальность: от 40%
Доступность: сразу
400 ₽
Готовая работа

Проектирование реализации операций бизнес-процесса «Управление денежными потоками»

Уникальность: от 40%
Доступность: сразу
900 ₽
Готовая работа

Создание базы данных

Уникальность: от 40%
Доступность: сразу
490 ₽
Готовая работа

Персональный компьютер, история создания и развития, важнейшие компоненты.

Уникальность: от 40%
Доступность: сразу
490 ₽
Готовая работа

Музыкальная картотека

Уникальность: от 40%
Доступность: сразу
300 ₽