Создан заказ №1133531
24 апреля 2016
Цель данного исследования заключается в реализации и исследовании методов автоматической кластеризации документов.
Как заказчик описал требования к работе:
Срочно нужно написать реферат по информатике ко вторнику. Список требований в файле.
Фрагмент выполненной работы:
Введение
В настоящее время в связи с увеличением текстовой информации в сети интернет возникает потребность в ее структурировании, тем самым повышается интерес к такой области искусственного интеллекта, как автоматическая обработка естественного языка (Natural Language Processing). Поэтому задача автоматической кластеризации документов (разбиения информации на более мелкие группы), решаемая в данном исследовании, представляется актуальной. (работа была выполнена специалистами Автор 24) Цель данного исследования заключается в реализации и исследовании методов автоматической кластеризации документов.
Под кластеризацией будем понимать разбиение массива информации на группы (кластеры) как уже было сказано такие, что внутри кластера буду находиться наиболее близкие объекты. А расстояние между кластерами будет максимально.
На протяжении последних десятилетий лавинообразное увеличение числа и общего объема создаваемых и хранимых человечеством документов делает автоматическую кластеризацию, т.е. разбиение текстовых массивов на систему подмножеств, помеченных какими-то их смысловыми описателями, одной из приоритетных задач, решаемых системами поддержки документооборота и другими информационными системами. Примеры частных случаев этой проблемы, интересных с точки зрения их применения в бизнесе и технологии, весьма многочисленны. Службы поддержки клиентов сталкиваются с задачей структурирования и анализа отзывов или жалоб клиентов с целью определения наиболее сильных источников их недовольства и раннего выявления новых причин недовольства.
Аналитическим службам производственных компаний приходится кластеризовать отчеты о нештатных ситуациях для организации более эффективного управления производством, выявления опасных трендов повышения потенциальной аварийности. Характерной чертой этих и многих других примеров является то, что кластеризуемые документы представляют собой не фиксированный массив, а скорее поток поступающих текстов, что делает актуальной более сложную задачу отслеживания динамики картины кластеризации. К этому типу относится и представляющая особый интерес в контексте данного исследования задача автоматической кластеризации новостного потока. Корректное разбиение новостного потока в соответствии с его тематической структурой важно не только для провайдеров новостей как фактор, повышающий удобство и привлекательность этого сервиса для его потребителей, но и для конечных пользователей, например, использующих новостную ленту в ручном или полуавтоматическом режиме для принятия решений по биржевым операциям. При этом альтернатива автоматическим методам кластеризации, ручная кластеризация, производимая экспертами, во многих случаях становится все менее и менее привлекательной вследствие растущей относительной дороговизны их труда и, часто, субъективности получающейся кластеризации.
В следующих разделах настоящей работы мне хотелось бы рассмотреть существующие техники кластеризации текстов, проанализировав присущие им слабые стороны, препятствующие удовлетворению сформулированных выше требованийПосмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик воспользовался гарантией, чтобы исполнитель повысил уникальность работы
25 апреля 2016
Заказ завершен, заказчик получил финальный файл с работой
5
Цель данного исследования заключается в реализации и исследовании методов автоматической кластеризации документов..docx
2016-04-28 21:11
Последний отзыв студента о бирже Автор24
Общая оценка
5
Положительно
Реферат получил оценку преподавателя 98 из 100 (отлично). Уникальность текста 52%. Пришлось не много отредактировать текст перед отправкой из-за мелких шероховатостей.
Спасибо, автору! Отличная работа!