Создан заказ №2943780
29 апреля 2018
По территориям региона приводятся данные за 2016 год Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного
Как заказчик описал требования к работе:
В файле 28 стр. 1-24 пример решения. 25-28 само задание. Требуется решить 2 задачи. Число букв в полном имени - 4, число букв в фамилии 8.
Фрагмент выполненной работы:
По территориям региона приводятся данные за 2016 год.
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., x
Среднедневная заработная плата, руб., y
1 820 1410
2 880 1480
3 870 1390
4 790 1540
5 1060 1610
6 1100 1950
7 670 1390
8 980 1660
9 810 1520
10 870 1620
11 860 1540
12 1140 1730
Требуется:
Построить линейное уравнение парной регрессии y по x.
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x, составляющего 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике отложить исходные данные и теоретическую прямую.
Проверить вычисления в MS Excel.
Решение:
Построить линейное уравнение парной регрессии y по x.
Для расчета параметров уравнения линейной регрессии строим расчетную таблицу.
№ x
y
y∙x
x2
y2
yx
y-yx
y-yx2
Ai
1 820 1410 1156200 672400 1988100 1491,72 -81,72 6678,16 5,8
2 880 1480 1302400 774400 2190400 1547,52 -67,52 4558,95 4,56
3 870 1390 1209300 756900 1932100 1538,22 -148,22 21969,17 10,66
4 790 1540 1216600 624100 2371600 1463,82 76,18 5803,39 4,95
5 1060 1610 1706600 1123600 2592100 1714,92 -104,92 11008,21 6,52
6 1100 1950 2145000 1210000 3802500 1752,12 197,88 39156,49 10,15
7 670 1390 931300 448900 1932100 1352,22 37,78 1427,33 2,72
8 980 1660 1626800 960400 2755600 1640,52 19,48 379,47 1,17
9 810 1520 1231200 656100 2310400 1482,42 37,58 1412,26 2,47
10 870 1620 1409400 756900 2624400 1538,22 81,78 6687,97 5,05
11 860 1540 1324400 739600 2371600 1528,92 11,08 122,77 0,72
12 1140 1730 1972200 1299600 2992900 1789,32 -59,32 3518,86 3,43
Итого 10850 18840 17231400 10022900 29863800 18839,94 0,06 102723 58,2
Среднее значение 904,17 1570 1435950 835241,67 2488650 1570,00 - 8560,25 4,85
σ
133,11 154,11 - - - - -
-
σ2
17718,28 23750 - - - - -
-
Находим параметры регрессии:
b=y∙x-y∙xx2-x2=1435950-1570∙904,17835241,67-904,172=16403,117718,28≈0,93
a=y-b∙x=1570-0,93∙904,17≈729,12
Получено уравнение регрессии:
y=729,12+0,93∙x
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
Тесноту линейной связи оценит коэффициент корреляции:
rxy=b∙σxσy=0,93∙133,11154,11≈0,803
Так как значение коэффициента корреляции больше 0,7, то это говорит о наличии весьма тесной линейной связи между признаками.
Коэффициент детерминации:
rxy2=0,8032=0,645
Это означает, что 64,5% вариации заработной платы (y) объясняется вариацией фактора x – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
A=1nyi-yxyi∙100=1nAi=58,212=4,85%
Качество построенной модели оценивается как хорошее, так как A не превышает 10%.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
Оценку статистической значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера. (работа была выполнена специалистами author24.ru) Фактическое значение F-критерия составляет:
Fфакт=rxy21-rxy2∙n-2=0,6451-0,645∙10≈18,17
Табличное значение критерия при 5% уровне значимости и степенях свободы k1=1 и k2=12-2=10 составляет Fтабл=4,96.
Так как Fфакт=18,17>Fтабл=4,96, то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии и корреляции проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.
Табличное значение t-критерия для числа степеней свободы df=n-2=12-2=10 и уровня значимости α=0,05 составит tтабл=2,23.
Определим стандартные ошибки ma, mb, mrxy (остаточная дисперсия на одну степень свободы Sост2=y-yx2n-2=10272310=10272,3):
ma=Sост2x2n2σx2=10272,3∙10022900122∙17718,28≈200,88
mb=Sост2n∙σx2=10272,312∙17718,28≈0,22
mrxy=1-rxy2n-2=1-0,64512-2≈0,188
Тогда:
ta=ama=729,12200,88≈3,63
tb=bmb=0,930,22≈4,23
trxy=rxymrxy=0,8030,188≈4,27
Фактические значения t-статистики превосходят табличное значение:
ta=3,63>tтабл=2,23;tb=4,23>tтабл=2,23; trxy=4,27>tтабл=2,23
поэтому параметры a,b и rxy не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии a и b...Посмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
30 апреля 2018
Заказ завершен, заказчик получил финальный файл с работой
5
По территориям региона приводятся данные за 2016 год
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного.docx
2018-05-03 19:55
Последний отзыв студента о бирже Автор24
Общая оценка
5
Положительно
Профессионал своего дела!!! Все без единой ошибки! Быстро, чётко, ясно! Спасибо, Вероника Анатольевна!