Студенческая работа на тему:

Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9

Создан заказ №3710939

8 марта 2019

Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9

Как заказчик описал требования к работе:

1. Установка RapidMiner и обновление его до последней версии 9.2 2. Установка компонентов textMining и WebMining 3. Использование оператора CrawlWeb для сохранения документов на рабочий компьютер 4. Использование компонента - Process Dociment from files и различных фильтров 5. Проведение кластеризац ии документов Сделать как можно быстре

подробнее

Фрагмент выполненной работы:

Необходимо провести анализ и кластеризацию данных, web - страниц при помощи программы RapidMiner v9.0. Решение: Необходимо провести анализ и кластеризацию данных, web - страниц при помощи программы RapidMiner v9.0. Создаем аккаунт на официальном сайте, скачиваем программу RapidMiner Studio. Выбираем тип лицензии Education. Устанавливаем программу на свой компьютер. После завершения установки. открываем программу и устанавливаем модули Web Mining и Text Processing. (работа была выполнена специалистами author24.ru) В модуле Web Mining выбираем Crawl Web для скачивания web –страниц. В параметрах модуля устанавливаем необходимые настройки: адрес сайта, папку для размещения скачанных страниц, максимальное количество скачанных страниц, максимальный объем страницы. 11049041021000 После нажатия на синий треугольник для запуска процесса, мы видим в результатах, что скачивания страниц не происходит. right000Скачиваем страницы вручную. Темы сайтов для скачивания страниц являются: «Экономика», «Спорт», «Дизайн», «Кино». По каждой из те скачиваем 10 страниц, 1 уровня вложенности. Из Text Processing выбираем модуль Process Documents from files для текстового анализа скачанных страниц. Устанавливаем свойства: кодировку: UTF-8, частотную характеристику TF-IDF, которая и показывает, как часто встречается какое - либо слово в документе, а также в скольких документах встречается это слово. right21272500 Добавляем на панель также модуль Clustering для определения параметров кластеризации. Выход модуля Process Documents from files соединяем со входом модуля Clustering, а выход модуля Clustering соединяем с выходом панели программы. right22606000 Дважды щелкнув по прямоугольнику модуля Process Documents from files устанавливаем необходимые фильтры для анализа и кластеризации данных. -137160000 8.1 Фильтр Extract Information предназначен для извлечения текста из web –страниц, удаляя все теги. Параметры установлены по умолчанию. 8.2 Фильтр Tokenize предназначен извлечения из текста отдельных слов. Параметры установлены по умолчанию. 8.3 Фильтр Tokens by (Length) предназначен для отбора слов по длине. Параметры отбора выставляем длину слов от 4 до 25 символов. 8.4 Фильтр Tokens by (Content) предназначен для отбора только русских или иностранных слов. Для выбора русских слов ставим галочку рядом с командой invert condition и записываем регулярное выражение [a-zA-Z]. 8.6 Фильтр Transform Cases предназначен для отбора слов, написанным в верхнем или нижнем регистре...Посмотреть предложения по расчету стоимости

Заказчик
заплатил

200 ₽

Заказчик не использовал рассрочку

Гарантия сервиса
Автор24

20 дней

Заказчик принял работу без использования гарантии

9 марта 2019

Заказ завершен, заказчик получил финальный файл с работой

Заказ выполнил

Luba4ka

Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9.docx

2019-03-12 22:17

Последний отзыв студента о бирже Автор24

Общая оценка

Положительно

Большое спасибо замечательному Автору! Работа была выполнена раньше срока и строго в соответствие с методическими указаниями! Контрольная оценена на "5"! Спасибо вам большое! Автора рекомендую!

Хочешь такую же работу?

Скидка

100 ₽

на первый заказ

Оставляя свои контактные данные и нажимая «Создать задание», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.

Хочешь написать работу самостоятельно?

Используй нейросеть

Мы создали собственный искусственный интеллект,
чтобы помочь тебе с учебой за пару минут 👇

Использовать нейросеть

Тебя также могут заинтересовать

по этому предмету по этому типу и предмету

Критерий Пирсона

Реферат

Информатика

Стоимость:

300 ₽

информатика

Контрольная работа

Информатика

Стоимость:

300 ₽

ВКР "Автоматизированное рабочее места менеджера по продажам бытовой техники.проф.Бизнес и информатик

Курсовая работа

Информатика

Стоимость:

700 ₽

Разработка веб- сайта для развлекательного комплекса

Дипломная работа

Информатика

Стоимость:

4000 ₽

4 работы по предмету Интеллектуал. техн-гии анализа данных

Контрольная работа

Информатика

Стоимость:

300 ₽

функциональный анализ электронных информационно-образовательных сред уральского государственного университета

Курсовая работа

Информатика

Стоимость:

700 ₽

Тема:"Высокопроизводительная система оповещения критических ошибок в сети предприятия через чат бота".

Дипломная работа

Информатика

Стоимость:

4000 ₽

Электронный журнал и электронный дневник школьника.

Доклад

Информатика

Стоимость:

300 ₽

Напишите программу которая определяет : сумму элементов массива ,значения которых больше среднего арифметичес

Задача по программированию

Информатика

ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ СРЕДСТВАМИ ПРЕЗЕНТАЦИИ

Контрольная работа

Информатика

Стоимость:

300 ₽

Учебная практика

Отчёт по практике

Информатика

Стоимость:

700 ₽

от выпуклого програмирыванию Increasing Returns математические аспекты и экономические перспективы

Реферат

Информатика

Стоимость:

300 ₽

Выполнить задание по Облачные технологии. С-02766

Контрольная работа

Информатика

Стоимость:

300 ₽

Планирование добычи руды в компании "Седьмой круг"

Контрольная работа

Информатика

Стоимость:

300 ₽

массивы, процедуры, форматный ввод-вывод на VBA

Контрольная работа

Информатика

Стоимость:

300 ₽

табулирование функции в эксель

Контрольная работа

Информатика

Стоимость:

300 ₽

задание в Quick Sales 2 Free 2.0.1.32

Контрольная работа

Информатика

Стоимость:

300 ₽

Контрольная работа по дисциплине "Информационные технологии управления"

Контрольная работа

Информатика

Стоимость:

300 ₽

Архитектура сети NGN, Расчет шлюза доступа в сети NGN, Расчет основных параметров шлюза доступа и коммутатора

Контрольная работа

Информатика

Стоимость:

300 ₽

Лабораторные по моделированию систем и процессов

Контрольная работа

Информатика

Стоимость:

300 ₽

Диалог пользователей с операционной системой.

Контрольная работа

Информатика

Стоимость:

300 ₽

Контрольная по информатике

Контрольная работа

Информатика

Стоимость:

300 ₽

Выполнить экзаменационный тест по Основы математики и информатики. М-03604

Контрольная работа

Информатика

Стоимость:

300 ₽

Выполнить задание по Тестирование ПО. (ТУСУР) М-03595

Контрольная работа

Информатика

Стоимость:

300 ₽

Читай полезные статьи в нашем

Помехоустойчивые коды

Цифровой сигнал, как и аналоговый, критичен к влиянию помех. Вероятность появления ошибок в канале связи зависит от самого канала. В кабельных системах передач, к примеру, она будет на много меньше, чем в системах цифровой радиосвязи, но не нулевой. Без возможности исправления ошибок качество принимаемого сигнала будет неудовлетворительным. При вероятности появления ошибок и скорости цифровых данн...

подробнее

Кодирование видеоинформации

Кодирование видеоинформации можно охарактеризовать тремя факторами:
Помимо устранения пространственной избыточности, эффективное временное предсказание движения деталей изображения и его компенсация всегда было ключевым фактором, определяющим общий коэффициент сжатия при кодировании видеоинформации. Практически реализованные системы кодирования используют блочную оценку движения и его компенсацию,...

подробнее

Мультимедиапроектор

По функциональному назначению проекторы делятся на основные группы:
Проекторы первой группы обычно ориентированы на воспроизведение динамичного контента, проекторы второй и третьей группы предназначены для динамичного и статичного контента. К отдельной группе можно отнести сверхминиатюрные проекторы весом до кг. Широко стали распространены проекторы, которые поддерживают передачу информац...

подробнее

Внеурочная деятельность по информатике

Внеурочная деятельность по школьному предмету "Информатика" (кружки, факультативы, конкурсы, викторины и т.п.) практически не регламентирована государственными органами образования. Ее организация является, как правило, прерогативой педагогического коллектива школы (в первую очередь преподавателя информатики) и межшкольных объединений. Могут быть организованы занятия по:
При развитии этого вида пед...

подробнее

Помехоустойчивые коды

подробнее

Кодирование видеоинформации

подробнее

Мультимедиапроектор

подробнее

Внеурочная деятельность по информатике

подробнее

Главная Лента заказов Контрольные работы Информатика Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9