Создан заказ №2804372
22 марта 2018
Кластеризация Интернет-пользователей и Интернет-ресурсов для оптимизации контента
Как заказчик описал требования к работе:
Нужно сделать дипломную работу по информационным технологиям за 7 дней, оформлять не нужно, главное все подробно расписать в дипломной и список источников литературы приложить.
Фрагмент выполненной работы:
ВВЕДЕНИЕ
Актуальность темы исследования. Интернет в 21-ом веке является неотъемлемой частью повседневной жизни. Экономическая, социальная и научная деятельность человечества в той или иной степени связана с Интернет-технологиями. В наши дни можно проводить переговоры с партнёрами по бизнесу, денежные переводы, онлайн консультации, обучение и многое другое не выходя из дома. Мобильный Интернет привязал человека к виртуальному миру – в любой момент времени и в любом месте на земном шаре, имея доступ к Интернету, можно быть в курсе всего, что происходит в реальном мире.
В последние годы в информационных источниках можно встретить общие сведения о применении методов кластеризации для классификации ИП и ИР. (работа была выполнена специалистами Автор 24) Декларируются различные цели применения методов кластерного анализа к Интернет-объектам, однако в подавляющем большинстве случаев детали этих методов и способов их применения не разглашаются. Так в работах [21, 30, 38] отмечается, что для кластеризации текстовой информации могут использоваться методы TF и TIDF, а также их модификации. Эти методы действительно подходят для кластеризации текстов газет, учебников, научных статей и других информационных ресурсов со статичным содержанием. Векторные и вероятностные модели, которые применяются поисковыми системами показывающие хорошие результаты на одних данных, оказываются много хуже тех же классических моделей на других данных. Можно ли с их помощью добиться приемлемых результатов для кластеризации ИП и, в особенности, для кластеризации современных высоко динамических ИР остается неизвестным.
Приведённые аргументы свидетельствуют о необходимости дальнейшего приспособления Интернета к нуждам пользователей и, в частности, за счет персонализации Интернет-поиска. Повышение уровня персонализации поиска, в свою очередь, может быть достигнуто за счет разработки перспективных методов классификации ИП и ИР, основанных на кластерном анализе, внедрения этих методов в существующие поисковые системы.
Целью дипломной работы является применение методов классического кластерного анализа для классификации ИП и ИР, для персонализации информационного поиска в Интернете. Для достижения поставленной цели требуется решить следующие основные задачи:
Проанализировать существующие некластерные методы классификации ИП и ИР. Проанализировать существующие методы кластерного анализа ИП и ИР, показать их преимущество по сравнению с некластерными методами.
Предложить адекватное математическое описание объектов исследования – ИП и ИР, обеспечивающее применение существующих алгоритмов кластеризации.
Выбрать алгоритм кластеризации ИП и ИР из числа известных методов кластерного анализа, позволяющий управлять результатом с помощью входных параметров.
Определить масштаб влияния информационной динамики Интернет- объектов на результаты их кластерного анализа. Предложить методы устранения динамических факторов при кластеризации ИП и ИР.
Разработать и применить оригинальный подход, основанный на принципе обобщения и одновременной кластерной обработки ИП и ИР.
Разработать программные средства для наблюдения за активностью ИП и сбора данных о страницах ИР, а также кластеризации ИП и ИР, оценки эффективности предлагаемых методов.
Объектом исследования являются методы персонализации Интернет- поиска, основанные на изучении и классификации ИП и ИР при помощи кластерного анализа.
Предметом исследования являются способы математического описания ИП и ИР, процедуры сбора и обработки информации об этих Интернет-объектах, позволяющие эффективно применять аппарат классического кластерного анализа для целей персонификации Интернет-поиска.
В основе дипломного исследования лежат методы статистического и кластерного анализа, теория графов, web mining и web-технологии. При проведении исследований и при изложении полученных материалов применяется систематический подход, базирующийся на анализе экспериментальных результатов. На каждом этапе работы, после проведения сравнительного анализа полученных результатов делаются выводы и выбираются наиболее рациональные подходы для продолжения исследований.
В дипломной работе представлены оригинальные методы, направленные на решение проблемы персонализации и повышения качества результатов поиска в Интернете. Эти методы позволяют использовать существующие классические алгоритмы кластерного анализа для Интернет-объектов – ИП и ИР – с учетом особенностей их математического описания. Для математического описания ИП и ИР предложено использовать характеристические вектора, числовые координаты, которых расположены в том же порядке, что и термины в глобальном словаре терминов поисковой системыПосмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
3000 ₽
Заказчик оплатил в рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик воспользовался гарантией, чтобы исполнитель повысил уникальность работы
29 марта 2018
Заказ завершен, заказчик получил финальный файл с работой
5
Кластеризация Интернет-пользователей и Интернет-ресурсов для оптимизации контента.docx
2020-06-18 13:04
Последний отзыв студента о бирже Автор24
Общая оценка
4.3
Положительно
Дипломная работа выполнена на высоком уровне со всеми рекомендациями преподавателя + оформлены все необходимые сопутствующие документы. Огромное спасибо автору!!!