Создан заказ №3493439
30 декабря 2018
Каждый студент получает два массива данных - доходы населения за 25 лет (25 чисел) (это случайная величина Х
Как заказчик описал требования к работе:
в файле варианты есть разъяснения,мой вариант 6 Лекарства. только в программе эксель. методичка №4, №5 если надо скину.не поместилась тут
Фрагмент выполненной работы:
Каждый студент получает два массива данных:
- доходы населения за 25 лет (25 чисел) (это случайная величина Х, обозначена в таблице DPI)
- расходы на определенный товар или услугу, н-р, на воду – Water (это случайная величина Y)
В таблице Б1 и Б2 приведены ежегодные данные о потребительских расходах и Располагаемых личных доходах для США на период с 1959 по 1983 г. Оцените регрессию между у и х, где х - располагаемый личный доход, а у - расходы на выбранный товар, используя данные за 25 лет. (работа была выполнена специалистами Автор 24) Дайте интерпретацию коэффициентов регрессии. Проверьте значимость коэффициента наклона в регрессии. Вычислите 95% доверительные интервалы для этого коэффициента. Каково значение коэффициента детерминации в этой регрессии. Прокомментируйте это.
Что нужно сделать:
Подсчитать характеристики обоих рядов (среднее, дисперсию, средне квадратическое отклонение). Построить корреляционное поле.
Подсчитать коэффициент корреляции r (по исходным рядам).
Построить модель парной линейной регрессии, оценить качество модели (подсчитать R2, множественный коэффициент корреляции). Сделать выводы.
Рассчитайте стандартную ошибку регрессии
Рассчитайте стандартные ошибки коэффициентов регрессии
Рассчитайте 95% доверительные интервалы для теоретических коэффициентов регрессии
Проанализируйте статистическую значимость коэффициентов при уровне значимости α=0,05
Оцените значимость коэффициента корреляции между доходами и расходами
Подсчитайте коэффициент детерминации и сравните его с коэффициентом корреляции
Сделайте выводы.
Год Доходы населения, Х Лекарства, Y
1959 479,7 98,8
1960 489,7 98,9
1961 503,8 97,8
1962 524,9 96,2
1963 542,3 95,4
1964 580,8 95,2
1965 616,3 94,8
1966 646,8 95,1
1967 673,5 94,7
1968 701,3 94,9
1969 722,5 95,9
1970 751,6 98
1971 779,2 99,7
1972 810,3 100
1973 865,3 100,3
1974 858,4 103,8
1975 875,8 112,5
1976 906,8 119,3
1977 942,9 127
1978 988,8 135,9
1979 1015,5 145,7
1980 1021,6 159,1
1981 1049,3 176,6
1982 1058,3 194,7
1983 1095,4 211,4
Решение:
Подсчитаем характеристики обоих рядов (среднее, дисперсию, средне квадратическое отклонение). Построим корреляционное поле.
Средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
среднее значение квадратов фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
Средне квадратическое отклонение :
По расположению точек, их концентрации в определенном направлении можно судить о наличие связи. На основании поля корреляции можно выдвинуть гипотезу, что между факторным признаком и результативным признаком существует прямая, линейная связь.
Подсчитаем коэффициент корреляции r (по исходным рядам):
Линейный коэффициент корреляции характеризует тесноту линейной связи между изучаемыми признаками. Его можно определить по следующей формуле:
,
Значения линейного коэффициента корреляции принадлежит промежутку [-1;1]. Связь между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
менее 0,1 отсутствует линейная связь0,1 < rxy < 0,3: слабая; 0,3 < rxy < 0,5: умеренная; 0,5 < rxy < 0,7: заметная; 0,7 < rxy < 0,9: высокая; 0,9 < rxy < 1: весьма высокая;
Для нашей задачи r = 0,800, что подтверждает вывод, сделанный ранее, что связь между признаками прямая, а также указывает на высокую взаимосвязь между располагаемым личным доходом и расходами на лекарства. Положительная величина свидетельствует о прямой связи между изучаемыми признаками
Построим модель парной линейной регрессии, оценить качество модели (подсчитать R2, множественный коэффициент корреляции). Сделать выводы.
Находим оценки параметров модели:
Подставим найденные параметры в уравнение получим:
.
Параметр показывает, что с увеличением располагаемого личного дохода на 1 ден. ед. расходы на лекарства возрастают в среднем на 0,14 ден. ед.
Коэффициент детерминации определяется по формуле:
Вычислим:
Множественный коэффициент детерминации, показывает, что около 64% вариации зависимой переменной - расходы на лекарства учтено в модели и обусловлено влиянием включенного фактора - располагаемый личный доход и на 36% — другими факторами, не включенными в модель.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет ...Посмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
20 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
31 декабря 2018
Заказ завершен, заказчик получил финальный файл с работой
5
Каждый студент получает два массива данных
- доходы населения за 25 лет (25 чисел) (это случайная величина Х.jpg
2020-12-09 22:08
Последний отзыв студента о бирже Автор24
Общая оценка
4.6
Положительно
Большое спасибо за вашу приверженность срокам, скорость доставки и преданность работе