Создан заказ №1532931
30 ноября 2016
Автоматизированное извлечение знаний из текста
Как заказчик описал требования к работе:
Срочно нужно написать реферат по информационным технологиям ко вторнику. Список требований в файле.
Фрагмент выполненной работы:
Введение
До 85% новых знаний аналитики до сих пор получают, изучая тексты. В ближайшем будущем наиболее востребованными станут системы с максимально автоматизированными ETL-процессами структурирования контента (extract, transfer, load — «извлечение, преобразование, загрузка»). Важной чертой таких систем будет функция оперативного анализа информации, полученной по запросу для выбора дальнейшего направления исследования документов (автопилотирование направления исследования), выполняемой с помощью методов интеллектуального анализа текста.
К наиболее актуальным средствам интеллектуального анализа текстов относятся технологии выделения фактографической информации об объектах с учетом анафорических ссылок на них (ссылочные местоимения на объект, поименованный в тексте); нечеткий поиск; тематическое и тональное (точное и полное) рубрицирование; кластерный анализ хранилищ и подборок документов; выделение ключевых тем; построение аннотаций; построение многомерных частотных распределений документов и их исследование с помощью OLAP-технологий; использование методов интеллектуального анализа текста для определения направления исследования больших подборок документов и извлечения новых знаний.
В современных системах используется двухфазная технология аналитической обработки. (работа была выполнена специалистами Автор 24) В первой фазе (ETL) производится автоматизированный анализ отдельных документов, структуризация их контента и формирование хранилищ исходной и аналитической информации. Во второй фазе (OLAP, Text Mining, Data Mining) — извлечение в оперативном режиме знаний из хранилища или из полученной по запросу подборки документов. На наш взгляд, к наиболее интересным системам аналитической обработки относятся ClearForest, Convera RetrievalWare, Hummingbird KM, IBM Text Miner, инструменты компании IQMen, Inxight Smart Discovery Extraction Server, Ontos Miner, Oracle Text, ODB-Text, TextAnalyst, инструменты компании Smartware, XANALYS Link Explorer, X-Files, инструменты компании «Гарант-Парк-Интернет» и «Медиалогия». Попробуем проанализировать современное состояние дел в области аналитических технологий на примерах конкретных систем.
Технологии извлечения знаний из текстов и их особенности.
К наиболее актуальным направлениям извлечения знаний из текста на сегодняшний день относятся:
аналитическая обработка фактов; ведение досье;
извлечение и структурирование фактографической информации;
поиск информации по запросам на естественном языке с использованием тезаурусов;
направления поиска информации, объектов в хранилище документов, в подборке документов;
аннотирование документов, построение дайджестов по объектам;
проведение тематического анализа документов (кластеризация и рубрицирование);
построение и динамический анализ семантической структуры текстов;
направления поискаПосмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик воспользовался гарантией для внесения правок на основе комментариев преподавателя
1 декабря 2016
Заказ завершен, заказчик получил финальный файл с работой
5
Автоматизированное извлечение знаний из текста.docx
2019-05-23 09:17
Последний отзыв студента о бирже Автор24
Общая оценка
5
Положительно
Вс хорошо, работа 80% оригинальности, правда дороговато, но это ещё и сервис берёт большую комиссию