Создан заказ №7442209
4 октября 2021
Итоговая работа по язык R в аналитике
Как заказчик описал требования к работе:
Дан набор датасетов по продажам банковских продуктов (депозиты): bank-full.csv - основной датасет, содержит данные о продажах банковских продуктов (депозитов) клиентам на основе телефонных звонков. Атрибутивный состав датасета представлен ниже: 1 - age (numeric) - возраст клиента 2 - job : (categori
cal: “admin.”, “unknown”, “unemployed”, “management”, “housemaid”, “entrepreneur”, “student”, “blue-collar”, “self-employed”, “retired”, “technician”, “services”) - род занятий клиента 3 - marital : (categorical: “married”, “divorced”, “single”) - семейной положение клиента 4 - education (categorical: “unknown”,“secondary”,“primary”,“tertiary”) - образование 5 - default: (binary: “yes”,“no”) - наличие кредита с просроченной задолженностью 6 - balance: (numeric) - среднемесячный баланс на счетах клиента (в евро) 7 - housing: (binary: “yes”,“no”) - наличие ипотеки 8 - loan: (binary: “yes”,“no”) - наличие потребительского кредита 9 - salary: (binary: “yes”,“no”) - наличие зарплатного проекта в банке у клиента 10 - contact: (categorical: “unknown”, “telephone”, “cellular”) - тип коммуникации с клиентом 11 - day: (numeric) - порядковый номер дня в месяце, когда была последняя коммуникация 12 - month: (categorical: “jan”, “feb”, “mar”, …, “nov”, “dec”) - месяц, когда была последняя коммуникация 13 - duration:(numeric) - длительность последней коммуникации в секундах 14 - campaign: (numeric, includes last contact) - количество контактов с клиентом в рамках данной рекламной кампании 15 - pdays: (numeric, -1 means client was not previously contacted) - число дней с прошлой коммуникации 16 - previous: (numeric) - число предыдущих коммуникаций с клиентом 17 - poutcome: (categorical: “unknown”, “other”, “failure”, “success”) - результат прошлых маркетинговых кампаний 18 - y: (binary: “yes”,“no”) - взял ли клиент депозит по итогу коммуникации (выходная переменная для классификации) 19 - deposittype (categorical: “max”, “optimum”, “saving”) - продукт, который выдан клиенту в итоге маркетинговой акции (тип депозита) bank-test.csv - тестовый датасет. Нужен только в случае, если в дипломной работе решается задача классификации. Имеет структуру, аналогичную датасету bank-full.csv deposits-tariff.csv - датасет, содержащий условия по депозитам, выданным клиентам в результате маркетинговой кампании. Атрибутивный состав датасета представлен ниже: 1 - deposittype (categorical: “max”, “optimum”, “saving”) - продукт, который выдан клиенту в итоге маркетинговой акции (тип депозита) 2 - drate: (numeric) - ставка по депозиту в процентах годовых 3 - duration: (numeric) - срок депозита в месяцах 4 - minbalance: (numeric) - минимальный первоначальный взнос 5 - replenishable: (binary: “yes”,“no”) - возможность пополнения депозита 6 - withdrawal: (binary: “yes”,“no”) - возможность частичного снятия Необходимо провести анализ данных продаж депозитов и эффективности маркетинговой кампании. Для этого требуется последовательно выполнить этапы анализа данных: Импортировать данные из источников. В данном случае источниками являются текстовые файлы с расширением csv. Очистить и подготовить данные: привести датасеты к удобному для анализа виду, обработать пропущенные и аномальные значения (пропущенные значения есть только в датасете bank-full.csv) Трансформировать данные. Объединить датасет с данными по маркетинговой кампании с информацией по тарифам депозитов. Провести визуальный анализ данных: построить диаграммы, показывающие результаты маркетинговой компании. Диаграммы на Ваше усмотрение, нужно обосновать свой выбор. Рассчитать и вывести показатели эффективности маркетинговой кампании: сколько процентов коммуникаций приводит к успеху, после какой коммуникации в среднем клиент берет новый продукт, какая средняя длительность успешной и неуспешной коммуникации) Рассчитать средний и общий расход от депозита в случае успешной кампании (на основе тарифа по формуле смоделировать сколько денег будет потрачено на выплату процентов, если: у человека на счету в среднем больше денег, чем требует минимальный взнос, то он положит минимальный взнос + 10% от своего среднемесячного баланса если депозит с возможностью снятия, то в среднем клиенты будут снимать 0,5% от остатка ежемесячно если депозит с возможностью пополнения, то клиенты будут класть на депозит 5% от своего среднемесячного остатка ежемесячно Следующие пункты нужно выполнять из набора А или Б. Для зачета достаточно выполнить один набор. Если есть желание, можно выполнить оба) А. Задание для тех, кто хочет углубиться в визуализацию данных: Проанализировать, какие клиенты берут новый продукт на основе маркетинговой кампании (составить портрет клиента: его профессию, средний возраст, семейное положение) Проанализировать, влияет ли наличие тех или иных продуктов на решение клиента взять депозит (построить корреляцию между наличием у клиента ЗП проекта, кредита и проч. и его решением, предварительно преобразовав бинарные переменные в числовые для корреляции) Б. Задание для тех, кто хочет углубиться в моделирование: Построить модель, которая на основе имеющихся данных о клиенте и маркетинговой компании будет предсказывать, возьмет ли клиент депозит (бинарная классификация) Проверить модель на датасете bank-test.csv Рассчитать ошибку модели (число ошибочных ответов к общему числу записей в тестовом датасете) Критерии проверки дипломной работы: Дипломная работа должна быть оформлена в виде проекта. Проект - это директория, содержащая обычно несколько файлов: .rproj - описание проекта .R - сам скрипт .RData - все сохраненные переменные .Rhistory - история выполненных команд Скрипт дипломной работы должен содержать подробные комментарии, иллюстрирующие порядок действий при анализе данных Результаты всех промежуточных шагов обработки данных должны быть сохранены в соответствующие переменные (например, результат импорта данных raw_bank, результат после очистки clean_bank и проч.) Результат анализа данных требуется оформить в виде RMarkdown, либо приложения Shiny
подробнее
Заказчик
заплатил
заплатил
20 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
5 октября 2021
Заказ завершен, заказчик получил финальный файл с работой
5
Итоговая работа по язык R в аналитике.jpg
2021-10-08 17:29
Последний отзыв студента о бирже Автор24
Общая оценка
5
Положительно
Автора рекомендую, т.к. работа выполнена в полном объёме, раньше срока и с соблюдением всех требований:)