Создан заказ №1218270
19 мая 2016
Параграф 4 Уточнение спецификации по переменным Построение корреляционной матрицы и столбца корреляции
Как заказчик описал требования к работе:
Необходимо сделать такую же работу, как в прикрепленных файлах. (Тоже два документа, с расчетами и описанием+выводы)
Тема работы: стоимость аренды жилья
Факторы:
1) Наличие недалеко от дома транспортного узла
2) Удаленность от метро
3) Количество комнат
4) Количество гипермаркетов недалеко от дом
а
5) Возраст дома
Район необходимо выбрать один для соблюдения условия однородности
подробнее
Фрагмент выполненной работы:
Параграф 4. Уточнение спецификации по переменным.
Построение корреляционной матрицы и столбца корреляции:
Для построения корреляционной матрицы и столбца корреляции нам для начала необходимо составить центрированную и нормированную выборку:
Желтый – центрированная и нормированная выборка.
center401002500center000После этого мы можем посчитать корреляции между моделью и регрессорами и между самими регрессорами и составить из них корреляционную матрицу.
Розовый – столбец корреляции, голубой – корреляционная матрица.
center000
Определитель корреляционной матрицы:
Как видно из изображения выше, определитель корреляционной матрицы = 0,226, т.е. (работа была выполнена специалистами author24.ru) связь между регрессорами сильная.
Анализ и исключение из модели одной или нескольких переменных:
Самое большое абсолютное значение у коэффициента корреляции rx3x4=0.596. Значит между этими двумя регрессорами (количество отметок «Мне нравится» профиля группы в Facebook и количество просмотров самого популярного видео группы на YouTube) самая сильная связь, т.е. чем больше у группы отметок «Мне нравится» в Facebook, тем больше просмотров у их самого популярного видео на YouTube, и наоборот. Значит, один из них нужно исключить, поскольку регрессоры с сильной корреляцией способны исказить нашу модель и обеспечить ее большое отклонение от гипотезы, а исключение одного из них позволит сделать нашу модель более точной.
Наименьший коэффициент корреляции с «у» у x4 (0.309), т.е. цена первого альбома группы при размещении его на iTunes меньше всего зависит от количества просмотров самого популярного видео группы на YouTube. Т.е. x4 можно исключить. Получаем новую корреляционную матрицу.
104140317500
Определитель новой корреляционной матрицы увеличился, стал дальше от 0 и составил 0,403. А это значит, что связь между регрессорами стала слабее, что хорошо, поскольку чем слабее связь между регрессорами, тем точнее наша модель.
Построение новой модели с меньшим числом регрессоров:
Наша новая модель будет иметь следующий вид:
y=a+b1*x1+b2*x2+b3*x3+b5*x5
Найти нам по - прежнему необходимо параметры модели (a,b1,b2,b3,b4).
Необходимые и достаточные условия те же (за исключением в них всех слагаемых с множителем x4)
-94297533528000Таким образом решение примет другой вид:
-908685409003500-918210317500
-889635407098500-899160381000Из вычислений, представленных выше можно сделать вывод, что параметры модели равны:
а=107.74b1=2.36b2= -0.02b3=0.015b5=14.21
А значит, модель имеет вид:
y=107.74+2.36x1-0.02x2+0.015x3+14.21x5
Т.е. когда группа размещает свой первый альбом на iTunes, цена на него в большей степени зависит от того, сколько прослушиваний у самого популярного трека группы на Soundcloud и от того, использовался ли какой-либо трек группы в качестве саундтрека к фильму, игре, сериалу и т.п. (подтверждается тем, что корреляция у обоих этих регрессоров с «у» наибольшая).
Кроме того, R2=0.4, а значит, модель можно использовать. Кроме того, это означает, что наша построенная модель совпадает с гипотезой (выборкой) на 40%. Таким образом, наша модель стала менее точной. Это можно объяснить тем, что связь с «у» (Цена альбома на iTunes) у исключенного регрессора x4 (количество просмотров самого популярного видео на YouTube) была важнее, чем у этого регрессора с соседним регрессором x3 (количество отметок «Мне нравится» профиля группы на Facebook). Также данный факт можно объяснить тем, что у регрессора x4 был достаточно весомый коэффициент (параметр) b4 (0.13) среди двух других регрессоров модели (x2,x3), которые в меньшей степени влияли на цену альбома.
Решение:
a=107.74; b1=2.36; b2=-0.02; b3=0.015; b5=14.21
y=107.74+2.36x1-0.02x2+0.015x3+14.21x5
R2=0.4
Параграф 5. Прогнозирование
Прогнозный набор регрессоров:
Для прогноза рассмотрим молодую группу из Америки Wildcat! Wildcat!, первый альбом которой был выпущен в январе 2015 года, и доступен на iTunes. Группа полностью попадает под описанную в 1 разделе данной работы однородность и стационарность ситуации, однако не была включена в выборку из-за того, что нужный объем выборки уже был достигнут.
Группа имеет следующие характеристики, которые далее будут описаны как прогнозные регрессоры:
x1n+1 (количество прослушиваний) – 0.313 (млн.)
x2n+1 (количество подписчиков) – 9.249 (тыс.)
x3n+1 (количество отметок «Мне нравится») – 15 (тыс.)
x5n+1 (OST) – 1
Таким образом, наша матрица прогнозных регрессоров будет выглядеть как:
Xn+1=(x1n+1x2n+1 x3n+1x5n+1)
Xn+1=(0.3139.249 151)
Вычисление прогноза Yn+1:
В соответствии с разделом 4.4 наша модель имеет вид:
y=107.74+2.36x1-0.02x2+0.015x3+14.21x5
Таким образом, используя прогнозные регрессоры раздела 5.1, прогнозная цена первого альбома группы Wildcat! Wildcat! должна составить:
yn+1=107.74+2.36x1n+1-0.02x2n+1+0.015x3n+1+14.21x5n+1=107.74+2.36*0.313-0.02*9.249+15*0.015+14.21*1=123 (руб.)
На самом же деле, альбом группы на iTunes стоит 149 руб. Т.е. прогноз можно назвать достаточно точным.
Вычисление Syn+12:
Для вычисления данного показателя, нам необходим воспользоваться формулой:
Syn+12=S2*(1+Xn+1*XT*X-1*Xn+1T), где
Xn+1 – матрица прогнозных регрессоров
XT – транспонированная матрица регрессоров выборки из 50 групп
X – матрица регрессоров выборки из 50 групп
Xn+1T – транспонированная матрица прогнозных регрессоров
S2= 1n-(k+1)*ei2,
а ei=yi-yi
Замечание:
Y в данном разделе и в разделе 4.4 немного отличаются, поскольку в разделе 4.4 использовались точные значения параметров модели, а в данном решении – приближенные.
-946785401383500-946785317500Оранжевый - матрица регрессоров выборки из 50 групп
Зеленый - матрица прогнозных регрессоров
Как видно из вычислений выше Syn+12=488.7496
Построение доверительного интервала с использованием двухстороннего критерия Стьюдента:
Доверительный интервал для реальной цены альбома yn+1 строится из расчета, что она лежит в пределах:
yn+1∈(yn+1-∆yn+1;yn+1+∆yn+1), где
∆yn+1=x0*Syn+1
а x0 берется из таблицы Двухсторонних квантилей распределения Стьюдента, для которых вероятность пусть будет P0=0.98, а число степеней свободы определяется по формуле n=(n-k+1), т.е. для нашего случая число степеней свободы = 45.
Таким образом, для нашего случая, x0=2.423.
Тогда, ∆yn+1=2.423*22.11=53.57 (руб.) – возможное отклонение по цене.
Таким образом, можно сделать вывод, что реальная цена альбома группы Wildcat! Wildcat! при его размещении на iTunes должна лежать в пределах yn+1∈(123-53.57;123-53.57), т.е. yn+1∈(69.43;176.57).
В реальности, как писалось в разделе 5.2, цена альбома составляет 149 руб., т.е. она попадает в найденный интервал...Посмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
20 мая 2016
Заказ завершен, заказчик получил финальный файл с работой
5
Параграф 4 Уточнение спецификации по переменным
Построение корреляционной матрицы и столбца корреляции.docx
2016-05-23 15:01
Последний отзыв студента о бирже Автор24
Общая оценка
4.1
Положительно
Все сделано в срок, автор постоянно на связи, недостатки устранила сразу. Спасибо, большое!