Создан заказ №2027404
5 мая 2017
Парсер текста на основе кластеризации
Как заказчик описал требования к работе:
Написать парсер текста на основе метода кластеризации k-средних. Язык с#/c++ . Написать подробную пояснительную записку + блок схемы алгоритмов. Детали обсудим
Фрагмент выполненной работы:
Введение
Data mining— это исследование и обнаружение «машиной» (алгоритмами, средствами искусственного интеллекта) ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации человеком знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Одной из задач Data Mining является кластеризация. Задача кластеризации состоит в разбиении множества объектов на группы, называемых кластерами. (работа была выполнена специалистами Автор 24) Внутри каждой группы должны оказаться «похожие» объекты, а объекты разных группы должны быть как можно более отличны. Главное отличие кластеризации от другой задачи data mining, классификации, состоит в том, что перечень групп четко не задан и определяется в процессе работы алгоритма. Таким образом кластеризация широко используется и как инструмент анализа сам по себе и как один из этапов предварительной обработки данных перед классификацией, например[2].
Возможность выявления скрытых взаимоотношений между данными как на множестве в целом, так и внутри каждого кластера по отдельности, а также улучшение восприятия аналитиками данных, разбитых на кластерную структуру — всё это делает методы кластерного анализа широко используемыми в самых различных областях. Кластеризации подвергаются данные по экономике и социологии, тексты, новостные потоки, блоги, генетические последовательности, изображения, данные социальных сетей, медицинские и биологические показатели и не только.
Развитие проектных репозиториев большинства машиностроительных предприятий достигло такого состояния, на котором анализ электронного архива технических документов становится весьма затруднительным. Возникает потребность в поиске новых способов хранения, систематизации и обработки текстовой информации в рамках предприятия. Это приводит к появлению новых и развитию существующих технологий. Примером является научное направление Semantic Web, в котором гипертекстовые страницы снабжаются дополнительной разметкой, несущей информацию о семантике включаемых в страницы элементов. Компонентом Semantic Web является понятие онтологии, описывающее смысл семантической разметки. На основе онтологии можно более эффективно решать задачи в области информационного поиска проектных документов, предметная область которых определена и формализована. В данной статье представлены модели, методы и инструменты, позволяющие создавать предметно-ориентированные онтологии, выполнять интеллектуальное индексирование проектных документов и их кластеризацию на основе онтологии.Посмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
500 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик воспользовался гарантией для внесения правок на основе комментариев преподавателя
8 мая 2017
Заказ завершен, заказчик получил финальный файл с работой
5
Парсер текста на основе кластеризации.docx
2020-10-19 11:47
Последний отзыв студента о бирже Автор24
Общая оценка
4.6
Положительно
Отличный автор. Сделал курсовую работу по объекто ориентированному программированию за 5 дней, оригиналость 90%. Цена за работу существенно ниже чем у других.