Создан заказ №1608292
21 декабря 2016
Информационно аналитические системы
Как заказчик описал требования к работе:
Решить 3 задания в программе deductor. Программу вышлю, задания внизу и написано все поэтапно
1. Data Mining
Задание 1. Сегментация клиентов телекоммуникационной компании (описательная аналитика).
Постановка задачи. Руководство филиала региональной телекоммуникационной компании, предоставляющей усл
уги мобильной связи, поставило задачу сегментацию абонентской базы. Ее целями являются:
• Построение профилей абонентов путем выявления их схожего поведения в плане частоты, длительности и времени звонков, а также ежемесячных расходов.
• Оценка наиболее и наименее доходных сегментов.
Эта информация может в дальнейшем использоваться для:
• Разработки маркетинговых акций, направленных на определенные группы клиентов;
• Разработки новых тарифных планов;
• Оптимизации расходов на адресную SMS-рассылку о новых услугах и тарифах; предотвращение оттока клиентов в другие компании.
Данные за последние несколько месяцев, взятые из биллинговой системы находятся в файле Абоненты.txt. Решение состоит из двух шагов:
1. Кластеризация объектов алгоритмом k-means;
2. Построение и интерпретация карты Кохонена.
Последовательность действий:
1. Импортируйте набор данных из указанного файла, запустите Мастер обработки и выберите узел Карта Кохонена.
2. Настройки нормализации: все поля, кроме Код, входные, поле Код-информационное, обучающее множество 100%, тестового множества нет. Размер карты 24 Х 18. Способ начальной инициализации- из обучающего множества.
3. Настройки визуализатора: входные столбцы, матрица ошибок квантования, матрица плотности попадания, кластеры.
4. После построения карт Конохена, оцените количество построенных кластеров, если оно больше 6, то измените его на 6.
5. Проанализируйте получившиеся карты, напишите выводы по каждой карте. Опишите профили абонентов, укажите наиболее и наименее доходные сегменты.
6. По каждому кластеру изучите статистические данные.
Ответ оформляется в электронном виде, состоит из скриншотов и выводов.
Задание 2. Ассоциативные правила в стимулировании розничных продаж (описательная аналитика)
Постановка задачи. Розничная сеть по продаже товаров бытовой химии поставила задачу анализа покупательских корзин для оптимизации размещения товаров на витринах и проведения кросс-продаж. Отдел маркетинга представил 5000 чеков, в которых отражены покупки, сделанные клиентами магазинов. Требуется:
• Предсказать, какие товары покупатели могут выбрать в зависимости от того, что у них уже есть в корзинах;
• Выявить наиболее популярные наборы, состоящие из более чем одного предмета.
Исходные данные представлены в файле Чеки.txt двумя полями - Номер транзакции и Товар. Поскольку номенклатура товаров бытовой химии очень разнообразна, решено ограничиться представлением товаров в обобщенной форме без торговых марок: порошки, моющие средства и т.д. (всего 37 наименований). Используя алгоритм Apriori, извлеките ассоциативные правила и проинтерпретируйте их. Для решения этой задачи используется обработчик Ассоциативные правила. На входе должно быть два поля: идентификатор транзакции (напр., номер чека или код клиента) и элемент транзакции (напр., наименование товара или услуга, заказанная клиентом).
Последовательность действий:
1. Импортируйте набор данных из указанного файла, к узлу импорта добавьте обработчик Ассоциативные правила. Поле ID сделайте идентификатором транзакции, а ITEM – ее элементом.
2. Настройки алгоритма оставьте по умолчанию, запустите поиск ассоциативных правил.
3. Выберите все доступные визуализаторы Data Mining и изучите результаты работы алгоритма.
4. Задайте для популярных наборов фильтр- минимальное значение поддержки 6%
5. Отсортируйте результаты по убыванию лифта.
6. На вкладке Дерево правил изучите условия и следствия.
7. Найдите тривиальные правила-лидеры продаж магазина или популярные наборы.
8. Дайте ответы на следующие вопросы:
a. Сколько частых наборов выявлено?
b. Сколько найдено ассоциативных правил?
c. Какие правила имеют мощность 2?
d. Приведите примеры ассоциативных правил: что нужно для того, чтобы получилось заданное следствие, или какие товары нужно продать для того, чтобы продать товар из следствия?
e. Какие правила являются тривиальными?
9. Интерпретируете ассоциативные правила (3-5 по своему выбору). Например:
Правило №3 кондиционер для белья -> стиральный порошок-автомат имеет S (поддержка)=3, 86%; C (достоверность) = 84,95% и L (лифт) =12,06. Это означает следующее:
• Ожидаемая вероятность покупки набора кондиционер для белья + стиральный порошок-автомат равно 3,86%.
• Если клиент положил в корзину кондиционер для белья, то с вероятностью 84,95% он купит и стиральный порошок-автомат.
• Клиент, купивший кондиционер для белья, в 12,06 раза чаще выберет стиральный порошок-автомат, нежели другой товар.
10. Запустите алгоритм Apriori (ассоциативные правила) c интервалом допустимой достоверности от 25 до 40%. Не рассматривая правила с лидерами продаж, найдите дополнительные правила (они должны быть понятны и иметь высокий лифт).
11. Напишите выводы о том, как компания может применить результаты ассоциативного анализа:
a. Осуществление кросс-продаж.
b. Рациональное размещение совместно покупаемых товаров на полках.
c. Наиболее доходные товарные позиции.
Задание 3. Голосование конгресса США (дерево решений)
Постановка задачи. На основании результатов 16 голосований необходимо предсказать политическую принадлежность американских сенаторов (республиканец или демократ).
Задача решается в два этапа:
1. Создание ветви сценария.
2. Интерпретация результатов.
Для создания ветви сценария используйте файл Голосование конгресса.txt. Для решения задачи используйте Мастер обработки, в качестве узла выберите Дерево решений. Поле Класс поставьте выходным, остальные-входными. Разбиение на множества- случайным образом, обучающее 95%, тестовое 5%. Определение способов отображения: Дерево решений, Правила, Значимость атрибутов, Таблица сопряженности, Что-если, Таблица. Остальные настройки сценария оставьте по умолчанию.
Для интерпретации результатов ответьте на следующие вопросы:
1. Сколько записей в наборе, сколько из них демократов, сколько республиканцев?
2. Укажите процентное соотношение демократов и республиканцев.
3. Определите самый значимый фактор в Дереве решений. В каких случаях можно сказать, что сенатор демократ, в каких, что он-республиканец?
4. Определите самый значимый фактор в визуализаторе Значимость атрибутов.
5. Какой закон вносит самый большой вклад в классификацию?
6. Проанализируйте визуализатор Правила: сколько правил выявлено?
7. Отсортируйте правила по поддержке, достоверности. Укажите максимальные и минимальные значения.
8. С помощью фильтра выберите те правила, согласно которым сенатор является демократом, с сортировкой по поддержке.
9. Укажите три правила, которые вызывают наибольшее доверие.
10. Какие законопроекты поддерживают республиканцы?
11. Какие законопроекты поддерживают демократы?
12. Есть ли законопроекты, против которых республиканцы выступают категорично? Если есть, укажите, какие.
13. Есть ли законопроекты, против которых демократы выступают категорично? Если есть, укажите, какие.
подробнее
Заказчик
заплатил
заплатил
20 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
22 декабря 2016
Заказ завершен, заказчик получил финальный файл с работой
5
Информационно аналитические системы .jpg
2017-10-20 19:23
Последний отзыв студента о бирже Автор24
Общая оценка
5
Положительно
Очень хороший и ответственный автор. Все было сделано досрочно и на высоком уровне. Рекомендую данного автора.