Рассчитай точную стоимость своей работы и получи промокод на скидку 200 ₽
Найди эксперта для помощи в учебе
Найти эксперта
+2
Пример заказа на Автор24
Студенческая работа на тему:
Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9
Создан заказ №3710939
8 марта 2019

Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9

Как заказчик описал требования к работе:
1. Установка RapidMiner и обновление его до последней версии 9.2 2. Установка компонентов textMining и WebMining 3. Использование оператора CrawlWeb для сохранения документов на рабочий компьютер 4. Использование компонента - Process Dociment from files и различных фильтров 5. Проведение кластеризац ии документов Сделать как можно быстре
подробнее
Фрагмент выполненной работы:
Необходимо провести анализ и кластеризацию данных, web - страниц при помощи программы RapidMiner v9.0. Решение: Необходимо провести анализ и кластеризацию данных, web - страниц при помощи программы RapidMiner v9.0. Создаем аккаунт на официальном сайте, скачиваем программу RapidMiner Studio. Выбираем тип лицензии Education. Устанавливаем программу на свой компьютер. После завершения установки. открываем программу и устанавливаем модули Web Mining и Text Processing. (работа была выполнена специалистами Автор 24) В модуле Web Mining выбираем Crawl Web для скачивания web –страниц. В параметрах модуля устанавливаем необходимые настройки: адрес сайта, папку для размещения скачанных страниц, максимальное количество скачанных страниц, максимальный объем страницы. 11049041021000 После нажатия на синий треугольник для запуска процесса, мы видим в результатах, что скачивания страниц не происходит. right000Скачиваем страницы вручную. Темы сайтов для скачивания страниц являются: «Экономика», «Спорт», «Дизайн», «Кино». По каждой из те скачиваем 10 страниц, 1 уровня вложенности. Из Text Processing выбираем модуль Process Documents from files для текстового анализа скачанных страниц. Устанавливаем свойства: кодировку: UTF-8, частотную характеристику TF-IDF, которая и показывает, как часто встречается какое - либо слово в документе, а также в скольких документах встречается это слово. right21272500 Добавляем на панель также модуль Clustering для определения параметров кластеризации. Выход модуля Process Documents from files соединяем со входом модуля Clustering, а выход модуля Clustering соединяем с выходом панели программы. right22606000 Дважды щелкнув по прямоугольнику модуля Process Documents from files устанавливаем необходимые фильтры для анализа и кластеризации данных. -137160000 8.1 Фильтр Extract Information предназначен для извлечения текста из web –страниц, удаляя все теги. Параметры установлены по умолчанию. 8.2 Фильтр Tokenize предназначен извлечения из текста отдельных слов. Параметры установлены по умолчанию. 8.3 Фильтр Tokens by (Length) предназначен для отбора слов по длине. Параметры отбора выставляем длину слов от 4 до 25 символов. 8.4 Фильтр Tokens by (Content) предназначен для отбора только русских или иностранных слов. Для выбора русских слов ставим галочку рядом с командой invert condition и записываем регулярное выражение [a-zA-Z]. 8.6 Фильтр Transform Cases предназначен для отбора слов, написанным в верхнем или нижнем регистре...Посмотреть предложения по расчету стоимости
Зарегистрируйся, чтобы получить больше информации по этой работе
Заказчик
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
20 дней
Заказчик принял работу без использования гарантии
9 марта 2019
Заказ завершен, заказчик получил финальный файл с работой
5
Заказ выполнил
Alpharius
5
скачать
Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9.docx
2019-03-12 22:17
Последний отзыв студента о бирже Автор24
Общая оценка
5
Положительно
Большое спасибо замечательному Автору! Работа была выполнена раньше срока и строго в соответствие с методическими указаниями! Контрольная оценена на "5"! Спасибо вам большое! Автора рекомендую!

Хочешь такую же работу?

Оставляя свои контактные данные и нажимая «Создать задание», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.
Хочешь написать работу самостоятельно?
Используй нейросеть
Мы создали собственный искусственный интеллект,
чтобы помочь тебе с учебой за пару минут 👇
Использовать нейросеть
Тебя также могут заинтересовать
замена блока питания
Презентации
Информатика
Стоимость:
300 ₽
Информатика
Контрольная работа
Информатика
Стоимость:
300 ₽
Планирование производства при смешивании соков
Контрольная работа
Информатика
Стоимость:
300 ₽
курсовая по информатике
Курсовая работа
Информатика
Стоимость:
700 ₽
Работа с массивами в MS Excel
Курсовая работа
Информатика
Стоимость:
700 ₽
«Подготовка оригинал-макетов в Publisher»
Курсовая работа
Информатика
Стоимость:
700 ₽
Комбинаторика
Контрольная работа
Информатика
Стоимость:
300 ₽
Программа и блок схема
Контрольная работа
Информатика
Стоимость:
300 ₽
Финун-т, проф. комп. программы, в-8 (часть 1)
Контрольная работа
Информатика
Стоимость:
300 ₽
Работа с таблицами Excel, задания в Power Point и Word
Контрольная работа
Информатика
Стоимость:
300 ₽
Питон
Контрольная работа
Информатика
Стоимость:
300 ₽
База данных Транспорт (движение общественного транспорта)
Контрольная работа
Информатика
Стоимость:
300 ₽
Планирование производства "Фирма Яхт-рем-строй"
Контрольная работа
Информатика
Стоимость:
300 ₽
Выполнить задание по Моделирование процессов и систем. К-00212
Контрольная работа
Информатика
Стоимость:
300 ₽
Выполнить задание по Моделирование процессов и систем. К-00213
Контрольная работа
Информатика
Стоимость:
300 ₽
Операционные системы и среды
Контрольная работа
Информатика
Стоимость:
300 ₽
Читай полезные статьи в нашем
Помехоустойчивые коды
Цифровой сигнал, как и аналоговый, критичен к влиянию помех. Вероятность появления ошибок в канале связи зависит от самого канала. В кабельных системах передач, к примеру, она будет на много меньше, чем в системах цифровой радиосвязи, но не нулевой. Без возможности исправления ошибок качество принимаемого сигнала будет неудовлетворительным. При вероятности появления ошибок и скорости цифровых данн...
подробнее
Кодирование видеоинформации
Кодирование видеоинформации можно охарактеризовать тремя факторами:
Помимо устранения пространственной избыточности, эффективное временное предсказание движения деталей изображения и его компенсация всегда было ключевым фактором, определяющим общий коэффициент сжатия при кодировании видеоинформации. Практически реализованные системы кодирования используют блочную оценку движения и его компенсацию,...
подробнее
Мультимедиапроектор
По функциональному назначению проекторы делятся на 3 основные группы:
Проекторы первой группы обычно ориентированы на воспроизведение динамичного контента, проекторы второй и третьей группы предназначены для динамичного и статичного контента. К отдельной группе можно отнести сверхминиатюрные проекторы весом до 0,5 кг. Широко стали распространены проекторы, которые поддерживают передачу информац...
подробнее
Внеурочная деятельность по информатике
Внеурочная деятельность по школьному предмету "Информатика" (кружки, факультативы, конкурсы, викторины и т.п.) практически не регламентирована государственными органами образования. Ее организация является, как правило, прерогативой педагогического коллектива школы (в первую очередь преподавателя информатики) и межшкольных объединений. Могут быть организованы занятия по:
При развитии этого вида пед...
подробнее
Помехоустойчивые коды
Цифровой сигнал, как и аналоговый, критичен к влиянию помех. Вероятность появления ошибок в канале связи зависит от самого канала. В кабельных системах передач, к примеру, она будет на много меньше, чем в системах цифровой радиосвязи, но не нулевой. Без возможности исправления ошибок качество принимаемого сигнала будет неудовлетворительным. При вероятности появления ошибок и скорости цифровых данн...
подробнее
Кодирование видеоинформации
Кодирование видеоинформации можно охарактеризовать тремя факторами:
Помимо устранения пространственной избыточности, эффективное временное предсказание движения деталей изображения и его компенсация всегда было ключевым фактором, определяющим общий коэффициент сжатия при кодировании видеоинформации. Практически реализованные системы кодирования используют блочную оценку движения и его компенсацию,...
подробнее
Мультимедиапроектор
По функциональному назначению проекторы делятся на 3 основные группы:
Проекторы первой группы обычно ориентированы на воспроизведение динамичного контента, проекторы второй и третьей группы предназначены для динамичного и статичного контента. К отдельной группе можно отнести сверхминиатюрные проекторы весом до 0,5 кг. Широко стали распространены проекторы, которые поддерживают передачу информац...
подробнее
Внеурочная деятельность по информатике
Внеурочная деятельность по школьному предмету "Информатика" (кружки, факультативы, конкурсы, викторины и т.п.) практически не регламентирована государственными органами образования. Ее организация является, как правило, прерогативой педагогического коллектива школы (в первую очередь преподавателя информатики) и межшкольных объединений. Могут быть организованы занятия по:
При развитии этого вида пед...
подробнее
Теперь вам доступен полный отрывок из работы
Также на e-mail вы получите информацию о подробном расчете стоимости аналогичной работы