Создан заказ №904079
4 января 2016
Анализ парной корреляции Вариант 4 В таблице 1 приведены данные о величине личного дохода и о десяти видах потребительских расходов населения США за период 1959 – 1983 гг
Как заказчик описал требования к работе:
Необходимо произвести расчеты согласно указанной теме (вариант 4) с пошаговым описанием процесса.
Фрагмент выполненной работы:
Анализ парной корреляции
Вариант 4
В таблице 1 приведены данные о величине личного дохода и о десяти видах потребительских расходов населения США за период 1959 – 1983 гг. Каждая переменная, приведена в млрд. долл. США.
Провести анализ парной корреляции между величиной дохода (факторная переменная) и величиной потребительского расхода (результирующая переменная).
Разработать уравнение линейной регрессии потребительского расхода на величину личного дохода. (работа была выполнена специалистами author24.ru)
Провести анализ адекватности полученной модели.
Представить соответствующие графики.
Примечание: при проверке гипотез о значимости коэффициента корреляции, значимости коэффициентов регрессии и построении доверительных интервалов для перечисленных коэффициентов принимать доверительную вероятность равной .
Таблица 1- Исходные данные для выполнения корреляционо-регрессионного анализа
Год Личный доход Потребительские раходы населения США, млрд. долл
табак
1959 544,9 10,7
1960 559,7 10,9
1961 575,4 11,2
1962 602 11,2
1963 622,9 11,4
1964 658 11,3
1965 700,4 11,6
1966 740,6 11,7
1967 774,4 11,8
1968 816,2 11,7
1969 853,5 11,4
1970 876,8 11,7
1971 900 11,8
1972 951,4 112,2
1973 1007,9 12,8
1974 1004,8 13
1975 1010,8 12,9
1976 1056,2 13,7
1977 1105,4 13,1
1978 1162,3 13,5
1979 1200,7 13,7
1980 1209,5 13,6
1981 1248,6 14
1982 1254,4 13,7
1983 1284,6 13
Решение:
Корреляционный анализ
Рис. 1. Корреляционное поле значений x и y
Из рисунка 1 видно, что облако точек расположено вдоль диагонали, проходящей из левого нижнего в правый верхний угол диаграммы. Вытянутость облака точек вдоль одной из диагоналей квадрата позволит предположить наличие корреляционной связи. Следовательно, можно предположить, что между величиной личного дохода и величиной факторного расхода существует прямая корреляционная связь.
Такой же вывод может быть сделан на основе анализа корреляционной таблицы 2, построенной путем группирования исходных данных по четырем интервалам значений по и четырем интервалам значений по .
Количество групп k приближенно можно определить исходя из объема наблюдений. При можно принять от 4 до 6 групп, при – от 6 до 8 групп.
Ширина интервалов по и при этом определяется из соотношений , , где и - размах вариации значений и соответственно.
Для данных, представленных в таблице 1, и , , (округления проведены в большую сторону с точностью до ).
Таблица 2 - Корреляционная таблица
Нижняя граница Группы по x
8,8 12,5 16,2 19,9
Верхняя граница 12,5 16,2 19,9 23,6
Среднее 10,65 14,35 18,05 21,75
Группы по y 10,7 11,6 11,2 7 0 0 0
11,6 12,5 12,1 1 5 0 0
12,5 13,4 13,0 0 1 4 0
13,4 14,3 13,9 0 0 2 5
11,5 12,1 13,3 13,7
9 5 5 6
Отложим на корреляционном поле значения групповых средних при значениях факторного признака, соответствующих серединам интервалов по и соединим данные точки отрезками прямых. Полученная ломанная называется эмпирической линией регрессии переменной на переменную . Эмпирическая линия регрессии по своему виду близка к прямой линии, что также позволяет выдвинуть предположение о наличии прямой корреляционной связи между переменной и переменной .
Проверку сделанных предположений проводят, осуществляя процедуры:
расчета выборочного коэффициента корреляции;
проверки статистической гипотезы о равенстве выборочного коэффициента корреляции нулю;
построения доверительных интервалов для коэффициента корреляции в генеральной совокупности значений и .
Выборочный коэффициент корреляции рассчитывается по следующей формуле:
Таблица 3 - Вспомогательная таблица для расчета коэффициента корреляции
№ x y
1 544,9 10,7 -364,0 -1,6 132464,0 2,4 569,2
2 559,7 10,9 -349,2 -1,4 121909,9 1,9 476,2
3 575,4 11,2 -333,5 -1,1 111192,9 1,1 354,8
4 602,0 11,2 -306,9 -1,1 94160,6 1,1 326,5
5 622,9 11,4 -286,0 -0,9 81770,8 0,7 247,1
6 658,0 11,3 -250,9 -1,0 62928,7 0,9 241,8
7 700,4 11,6 -208,5 -0,7 43453,9 0,4 138,4
8 740,6 11,7 -168,3 -0,6 28310,1 0,3 94,9
9 774,4 11,8 -134,5 -0,5 18078,4 0,2 62,4
10 816,2 11,7 -92,7 -0,6 8585,1 0,3 52,3
11 853,5 11,4 -55,4 -0,9 3064,3 0,7 47,8
12 876,8 11,7 -32,1 -0,6 1027,6 0,3 18,1
13 900,0 11,8 -8,9 -0,5 78,4 0,2 4,1
14 951,4 11,2 42,5 -1,1 1810,0 1,1 -45,3
15 1007,9 12,8 99,0 0,5 9809,7 0,3 53,1
16 1004,8 13,0 95,9 0,7 9205,3 0,5 70,6
17 1010,8 12,9 101,9 0,6 10392,6 0,4 64,8
18 1056,2 13,7 147,3 1,4 21710,3 2,1 211,6
19 1105,4 13,1 196,5 0,8 38629,5 0,7 164,3
20 1162,3 13,5 253,4 1,2 64233,9 1,5 313,3
21 1200,7 13,7 291,8 1,4 85172,9 2,1 419,1
22 1209,5 13,6 300,6 1,3 90386,8 1,8 401,7
23 1248,6 14,0 339,7 1,7 115426,0 3,0 589,8
24 1254,4 13,7 345,5 1,4 119400,7 2,1 496,2
25 1284,6 13,0 375,7 0,7 141183,6 0,5 276,5
22721,4 306,6 0,0 0,0 1414385,9 26,9 5649,4
Значение коэффициента корреляции очень близко к +1, что указывает на наличие очень тесной линейной связи между исследуемыми переменными.
Проверим гипотезу о значимости коэффициента корреляции. Выберем уровень значимости и рассчитаем значение величины
По таблице значений критических точек распределения Стьюдента (Приложение 1) при 23 степенях свободы (25 -2) и уровне значимости находим значение . Следовательно, рассчитанное значение коэффициента корреляции не может быть объяснено только случайными причинами и связь необходимо признать значимой.
Рассчитаем - й доверительный интервал для коэффициента корреляции в генеральной совокупности значений факторного и результирующего признаков:
Таким образом, интервал 0,845 – 0,985 с вероятностью 95% содержит в себе значение коэффициента корреляции в генеральной совокупности значений факторного и результирующего признака.
Регрессионный анализ
Разработаем уравнение линейной регрессии расходов табак на величину личного дохода по данным рассматриваемого примера. Для проведения расчетов сформируем вспомогательную таблицу 4...Посмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
5 января 2016
Заказ завершен, заказчик получил финальный файл с работой
5
Анализ парной корреляции
Вариант 4
В таблице 1 приведены данные о величине личного дохода и о десяти видах потребительских расходов населения США за период 1959 – 1983 гг.docx
2016-01-08 14:19
Последний отзыв студента о бирже Автор24
Общая оценка
5
Положительно
спасибо за работу!автор молодец!профессионал своего дела!все сделано по требованиям и в срок!