+
Подробнее о работе
Гарантия сервиса Автор24
Уникальность не ниже 50%
1.Построим с помощью метода наименьших квадратов уравнение множественной линейной регрессии y = a0 + a1x1 + a2x2 .
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения: s = (XTX)-1XTY
К матрице с переменными Xj добавляем единичный столбец
1 43 18,9
1 64,7 13,7
1 24 18,5
1 50,2 4,8
1 106 21,8
1 96,6 5,8
1 347 99
1 85,6 20,1
1 745 60,6
1 4,1 14
1 50,2 4,8
1 106 21,8
1 96,6 5,8
1 347 99
1 85,6 20,1
1 745 60,6
1 4,1 1,4
1 56,8 8
1 42,7 18,9
1 61,8 13,2
Матрица Y
0,9
1,7
0,7
1,7
2,6
1,3
4,1
1,6
6,9
0,4
1,7
2,6
1,3
4,1
1,6
6,9
0,4
1,3
1,9
1,9
Матрица XT
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
43 64,7 24 50,2 106 96,6 347 85,6 745 4,1 50,2 106 96,6 347 85,6 745 4,1 56,8 42,7 61,8
18,9 13,7 18,5 4,8 21,8 5,8 99 20,1 60,6 14 4,8 21,8 5,8 99 20,1 60,6 1,4 8 18,9 13,2
Умножаем матрицы, (XTX)
20 3162 530,8
XT X = 3162 1427211,4 172948,62
530,8 172948,62 30499,14
В матрице, (XTX) число 20, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X
Умножаем матрицы, (XTY)
45,6
XT Y = 14814,52
1987,96
Находим обратную матрицу (XTX)-1
0,093368 -0,000032 -0,001445
-0,000032 0,000002 -0,000012
-0,001445 -0,000012 0,000127
Вектор оценок коэффициентов регрессии равен
0,91463237
Y(X) = 0,00762063
0,00604921
Уравнение регрессии (оценка уравнения регрессии)
2.Проверим качество регрессионной модели. Для этого составим вспомогательную таблицу:
У Х1
Х2
У(х) ε = Y - Y(x) ε2 (Y-Yср)2 |ε : Y|
0,9 43 18,9 1,36 -0,46 0,21 1,90 0,51
1,7 64,7 13,7 1,49 0,21 0,04 0,34 0,12
0,7 24 18,5 1,21 -0,51 0,26 2,50 0,73
1,7 50,2 4,8 1,33 0,37 0,14 0,34 0,22
2,6 106 21,8 1,85 0,75 0,56 0,10 0,29
1,3 96,6 5,8 1,69 -0,39 0,15 0,96 0,30
4,1 347 99 4,16 -0,06 0,00 3,31 0,01
1,6 85,6 20,1 1,69 -0,09 0,01 0,46 0,06
6,9 745 60,6 6,96 -0,06 0,00 21,34 0,01
0,4 4,1 14 1,03 -0,63 0,40 3,53 1,58
1,7 50,2 4,8 1,33 0,37 0,14 0,34 0,22
2,6 106 21,8 1,85 0,75 0,56 0,10 0,29
1,3 96,6 5,8 1,69 -0,39 0,15 0,96 0,30
4,1 347 99 4,16 -0,06 0,00 3,31 0,01
1,6 85,6 20,1 1,69 -0,09 0,01 0,46 0,06
6,9 745 60,6 6,96 -0,06 0,00 21,34 0,01
0,4 4,1 1,4 0,95 -0,55 0,31 3,53 1,39
1,3 56,8 8 1,40 -0,10 0,01 0,96 0,07
1,9 42,7 18,9 1,35 0,55 0,30 0,14 0,29
1,9 61,8 13,2 1,47 0,43 0,19 0,14 0,23
Сумма: 45,60 3162,00 530,80 45,60 0,00 3,43 66,09 6,67
2.1. Точность соответствия эмпирическим данным;
Вычислим среднюю ошибку аппроксимации.
,
В среднем, расчетные значения отклоняются от фактических на 33,77%. Поскольку ошибка больше 7%, то данное уравнение нежелательно использовать в качестве регрессии.
Оценка дисперсии равна:
se2 = (Y - X*Y(X))T(Y - X*Y(X)) = 3.43
Несмещенная оценка дисперсии равна:
Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):
2.2. Значимость уравнения регрессии в целом на уровне 0,01 и 0,05;
Определим множественный коэффициент детерминации.
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y. Так как коэффициент детерминации отличен от нуля, связь между показателями существует, уравнение регрессии достаточно точно описывает поведение у.
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: R2 = 0; β1 = β2 = ... = βm = 0.
H1: R2 ≠ 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка).
Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
Уровень значимости 0,05:
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 20 - 2 - 1 = 17, Fkp(2;17) = 3.59.
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.
Уровень значимости 0,01:
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 20 - 2 - 1 = 17, Fkp(2;17) = 6.11
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно
2.3. Статистическую значимость параметров регрессии на уровне 0,01 и 0,05;
Найдем оценку ковариационной матрицы вектора k = S2 • (XTX)-1
0,01867361 -0,00000636 -0,00028893
-0,00000636 0,00000045 -0,00000244
-0,00028893 -0,00000244 0,00002543
Дисперсии параметров модели определяются соотношением S2i = Kii, т.е. это элементы, лежащие на главной диагонали
Определим значение t-статистик критерия Стьюдента:
Уровень значимости 0,01:
Табличное значение критерия при уровне значимости 0,01 и числе степеней свободы k 17 составит
Tтабл (n-m-1;α/2) = (17;0.005) = 2.898
Статистическая значимость коэффициента регрессии b0 подтверждается.
Статистическая значимость коэффициента регрессии b1 подтверждается.
Статистическая значимость коэффициента регрессии b2 не подтверждается.
Уровень значимости 0,05:
Табличное значение критерия при уровне значимости 0,05 и числе степеней свободы k 17 составит
Tтабл (n-m-1;α/2) = (17;0.025) = 2.11
Статистическая значимость коэффициента регрессии b0 подтверждается.
Статистическая значимость коэффициента регрессии b1 подтверждается.
Статистическая значимость коэффициента регрессии b2 не подтверждается.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(bi - ti Sbi; bi + ti Sbi)
b0: (0.91 - 2.11 • 0.14 ; 0.91 + 2.11 • 0.14) = (0.62;1.2)
b1: (0.00762 - 2.11 • 0.000674 ; 0.00762 + 2.11 • 0.000674) = (0.0062;0.00904)
b2: (0.00605 - 2.11 • 0.00507 ; 0.00605 + 2.11 • 0.00507) = (-0.00464;0.0167)
3.Оценим наличие мультиколлинеарности на основе матрицы парных корреляций.
Матрица парных коэффициентов корреляции:
- y
x1 x2
y
1 0.971 0.747
x1 0.971 1 0.722
x2 0.747 0.722 1
Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.
В нашем случае rx1 x2 имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа.
Наиболее полным алгоритмом исследования мультиколлинеарности является алгоритм Фаррара-Глобера.
Проверим переменные на мультиколлинеарность методом Фаррара-Глоубера по первому виду статистических критериев (критерий "хи-квадрат").Форму
Отсутствует
В предложенных задачах приведены данные наблюдения за факторами X1, X2 и результатами Y. В соответствии со своим вариантом, выполните следующие задания:
1.Постройте с помощью метода наименьших квадратов уравнение множественной линейной регрессии y = a0 + a1x1 + a2x2 и дайте его экономическую интерпретацию;
2.Проверьте качество регрессионной модели:
2.1. Точность соответствия эмпирическим данным;
2.2. Значимость уравнения регрессии в целом на уровне 0,01 и 0,05;
2.3. Статистическую значимость параметров регрессии на уровне 0,01 и 0,05;
3.Оцените наличие мультиколлинеарности на основе матрицы парных корреляций и любым другим методом;
4.Выполните 2 теста обнаружения гетероскедастичности случайной компоненты;
5.Выполните 2 теста обнаружения автокорреляции случайной компоненты;
6. По наилучшей регрессионной модели рассчитайте точечный и интервальный прогноз результирующей переменной y при x1 = 0,9× x1 и x2 =1,1× x2.
7. Оформите результаты по каждому пункту в пояснительной записке.
Сформулируйте выводы по проведенному регрессионному анализу.
Имеются данные о деятельности 20 компаний США – о чистом доходе (Y, млрд. долл.), численности служащих (Х1, тыс. чел.) и использованном капитале (Х2, млрд. долл.):
У Х1
Х2
У Х1
Х2
0,9 43 18,9 1,7 50,2 4,8
1,7 64,7 13,7 2,6 106 21,8
0,7 24 18,5 1,3 96,6 5,8
1,7 50,2 4,8 4,1 347 99
2,6 106 21,8 1,6 85,6 20,1
1,3 96,6 5,8 6,9 745 60,6
4,1 347 99 0,4 4,1 1,4
1,6 85,6 20,1 1,3 56,8 8
6,9 745 60,6 1,9 42,7 18,9
0,4 4,1 14 1,9 61,8 13,2
Отсутствует
Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям
1.Построим с помощью метода наименьших квадратов уравнение множественной линейной регрессии y = a0 + a1x1 + a2x2 .
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения: s = (XTX)-1XTY
К матрице с переменными Xj добавляем единичный столбец
1 43 18,9
1 64,7 13,7
1 24 18,5
1 50,2 4,8
1 106 21,8
1 96,6 5,8
1 347 99
1 85,6 20,1
1 745 60,6
1 4,1 14
1 50,2 4,8
1 106 21,8
1 96,6 5,8
1 347 99
1 85,6 20,1
1 745 60,6
1 4,1 1,4
1 56,8 8
1 42,7 18,9
1 61,8 13,2
Матрица Y
0,9
1,7
0,7
1,7
2,6
1,3
4,1
1,6
6,9
0,4
1,7
2,6
1,3
4,1
1,6
6,9
0,4
1,3
1,9
1,9
Матрица XT
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
43 64,7 24 50,2 106 96,6 347 85,6 745 4,1 50,2 106 96,6 347 85,6 745 4,1 56,8 42,7 61,8
18,9 13,7 18,5 4,8 21,8 5,8 99 20,1 60,6 14 4,8 21,8 5,8 99 20,1 60,6 1,4 8 18,9 13,2
Умножаем матрицы, (XTX)
20 3162 530,8
XT X = 3162 1427211,4 172948,62
530,8 172948,62 30499,14
В матрице, (XTX) число 20, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X
Умножаем матрицы, (XTY)
45,6
XT Y = 14814,52
1987,96
Находим обратную матрицу (XTX)-1
0,093368 -0,000032 -0,001445
-0,000032 0,000002 -0,000012
-0,001445 -0,000012 0,000127
Вектор оценок коэффициентов регрессии равен
0,91463237
Y(X) = 0,00762063
0,00604921
Уравнение регрессии (оценка уравнения регрессии)
2.Проверим качество регрессионной модели. Для этого составим вспомогательную таблицу:
У Х1
Х2
У(х) ε = Y - Y(x) ε2 (Y-Yср)2 |ε : Y|
0,9 43 18,9 1,36 -0,46 0,21 1,90 0,51
1,7 64,7 13,7 1,49 0,21 0,04 0,34 0,12
0,7 24 18,5 1,21 -0,51 0,26 2,50 0,73
1,7 50,2 4,8 1,33 0,37 0,14 0,34 0,22
2,6 106 21,8 1,85 0,75 0,56 0,10 0,29
1,3 96,6 5,8 1,69 -0,39 0,15 0,96 0,30
4,1 347 99 4,16 -0,06 0,00 3,31 0,01
1,6 85,6 20,1 1,69 -0,09 0,01 0,46 0,06
6,9 745 60,6 6,96 -0,06 0,00 21,34 0,01
0,4 4,1 14 1,03 -0,63 0,40 3,53 1,58
1,7 50,2 4,8 1,33 0,37 0,14 0,34 0,22
2,6 106 21,8 1,85 0,75 0,56 0,10 0,29
1,3 96,6 5,8 1,69 -0,39 0,15 0,96 0,30
4,1 347 99 4,16 -0,06 0,00 3,31 0,01
1,6 85,6 20,1 1,69 -0,09 0,01 0,46 0,06
6,9 745 60,6 6,96 -0,06 0,00 21,34 0,01
0,4 4,1 1,4 0,95 -0,55 0,31 3,53 1,39
1,3 56,8 8 1,40 -0,10 0,01 0,96 0,07
1,9 42,7 18,9 1,35 0,55 0,30 0,14 0,29
1,9 61,8 13,2 1,47 0,43 0,19 0,14 0,23
Сумма: 45,60 3162,00 530,80 45,60 0,00 3,43 66,09 6,67
2.1. Точность соответствия эмпирическим данным;
Вычислим среднюю ошибку аппроксимации.
,
В среднем, расчетные значения отклоняются от фактических на 33,77%. Поскольку ошибка больше 7%, то данное уравнение нежелательно использовать в качестве регрессии.
Оценка дисперсии равна:
se2 = (Y - X*Y(X))T(Y - X*Y(X)) = 3.43
Несмещенная оценка дисперсии равна:
Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):
2.2. Значимость уравнения регрессии в целом на уровне 0,01 и 0,05;
Определим множественный коэффициент детерминации.
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y. Так как коэффициент детерминации отличен от нуля, связь между показателями существует, уравнение регрессии достаточно точно описывает поведение у.
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: R2 = 0; β1 = β2 = ... = βm = 0.
H1: R2 ≠ 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка).
Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
Уровень значимости 0,05:
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 20 - 2 - 1 = 17, Fkp(2;17) = 3.59.
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.
Уровень значимости 0,01:
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 20 - 2 - 1 = 17, Fkp(2;17) = 6.11
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно
2.3. Статистическую значимость параметров регрессии на уровне 0,01 и 0,05;
Найдем оценку ковариационной матрицы вектора k = S2 • (XTX)-1
0,01867361 -0,00000636 -0,00028893
-0,00000636 0,00000045 -0,00000244
-0,00028893 -0,00000244 0,00002543
Дисперсии параметров модели определяются соотношением S2i = Kii, т.е. это элементы, лежащие на главной диагонали
Определим значение t-статистик критерия Стьюдента:
Уровень значимости 0,01:
Табличное значение критерия при уровне значимости 0,01 и числе степеней свободы k 17 составит
Tтабл (n-m-1;α/2) = (17;0.005) = 2.898
Статистическая значимость коэффициента регрессии b0 подтверждается.
Статистическая значимость коэффициента регрессии b1 подтверждается.
Статистическая значимость коэффициента регрессии b2 не подтверждается.
Уровень значимости 0,05:
Табличное значение критерия при уровне значимости 0,05 и числе степеней свободы k 17 составит
Tтабл (n-m-1;α/2) = (17;0.025) = 2.11
Статистическая значимость коэффициента регрессии b0 подтверждается.
Статистическая значимость коэффициента регрессии b1 подтверждается.
Статистическая значимость коэффициента регрессии b2 не подтверждается.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(bi - ti Sbi; bi + ti Sbi)
b0: (0.91 - 2.11 • 0.14 ; 0.91 + 2.11 • 0.14) = (0.62;1.2)
b1: (0.00762 - 2.11 • 0.000674 ; 0.00762 + 2.11 • 0.000674) = (0.0062;0.00904)
b2: (0.00605 - 2.11 • 0.00507 ; 0.00605 + 2.11 • 0.00507) = (-0.00464;0.0167)
3.Оценим наличие мультиколлинеарности на основе матрицы парных корреляций.
Матрица парных коэффициентов корреляции:
- y
x1 x2
y
1 0.971 0.747
x1 0.971 1 0.722
x2 0.747 0.722 1
Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.
В нашем случае rx1 x2 имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа.
Наиболее полным алгоритмом исследования мультиколлинеарности является алгоритм Фаррара-Глобера.
Проверим переменные на мультиколлинеарность методом Фаррара-Глоубера по первому виду статистических критериев (критерий "хи-квадрат").Форму
Отсутствует
В предложенных задачах приведены данные наблюдения за факторами X1, X2 и результатами Y. В соответствии со своим вариантом, выполните следующие задания:
1.Постройте с помощью метода наименьших квадратов уравнение множественной линейной регрессии y = a0 + a1x1 + a2x2 и дайте его экономическую интерпретацию;
2.Проверьте качество регрессионной модели:
2.1. Точность соответствия эмпирическим данным;
2.2. Значимость уравнения регрессии в целом на уровне 0,01 и 0,05;
2.3. Статистическую значимость параметров регрессии на уровне 0,01 и 0,05;
3.Оцените наличие мультиколлинеарности на основе матрицы парных корреляций и любым другим методом;
4.Выполните 2 теста обнаружения гетероскедастичности случайной компоненты;
5.Выполните 2 теста обнаружения автокорреляции случайной компоненты;
6. По наилучшей регрессионной модели рассчитайте точечный и интервальный прогноз результирующей переменной y при x1 = 0,9× x1 и x2 =1,1× x2.
7. Оформите результаты по каждому пункту в пояснительной записке.
Сформулируйте выводы по проведенному регрессионному анализу.
Имеются данные о деятельности 20 компаний США – о чистом доходе (Y, млрд. долл.), численности служащих (Х1, тыс. чел.) и использованном капитале (Х2, млрд. долл.):
У Х1
Х2
У Х1
Х2
0,9 43 18,9 1,7 50,2 4,8
1,7 64,7 13,7 2,6 106 21,8
0,7 24 18,5 1,3 96,6 5,8
1,7 50,2 4,8 4,1 347 99
2,6 106 21,8 1,6 85,6 20,1
1,3 96,6 5,8 6,9 745 60,6
4,1 347 99 0,4 4,1 1,4
1,6 85,6 20,1 1,3 56,8 8
6,9 745 60,6 1,9 42,7 18,9
0,4 4,1 14 1,9 61,8 13,2
Отсутствует
Купить эту работу vs Заказать новую | ||
---|---|---|
0 раз | Куплено | Выполняется индивидуально |
Не менее 40%
Исполнитель, загружая работу в «Банк готовых работ» подтверждает, что
уровень оригинальности
работы составляет не менее 40%
|
Уникальность | Выполняется индивидуально |
Сразу в личном кабинете | Доступность | Срок 1—4 дня |
100 ₽ | Цена | от 20 ₽ |
Не подошла эта работа?
В нашей базе 23392 Решения задач — поможем найти подходящую