все хорошо, спасибо за работу!
Подробнее о работе
Гарантия сервиса Автор24
Уникальность не ниже 50%
Контрольная работа по дисциплине "Анализ данных"
Тема: «Дисперсионный анализ».
С подробным решением и графиками
Сдана на отлично
Содержание
Задача № 5 …………………………………………………………………... 3
Запишите и прокомментируйте формулу для каждой из указанных ниже величин, которые используются в однофакторном дисперсионном анализе.
Общий размер выборки, n.
Общее (главное) среднее, Х ̅.
Межгрупповая вариация и соответствующее число степеней свободы.
Внутригрупповая вариация и соответствующее число степеней свободы.
F – статистика и соответствующее число степеней свободы.
F - таблица.
Задача № 7………………………………………………………………….. 4
Была осуществлена проверка трех рекламных акций. В каждом случае использовались разные случайные выборки потребителей из одного и того же города. Оценки характеризуют эффективность рекламы; результаты приведены в следующей таблице:
Реклама - 1 Реклама - 2 Реклама - 3
Среднее 63,2 68,1 53,5
Стандартное отклонение 7,9 11,3 9,2
Размер выборки (потребителей) 101 97 105
Какая реклама оказалась наиболее, а какая наименее эффективной?
Определите общий объем выборки, n, общее среднее, X ̅, и число выборок k.
Вычислите межгрупповую вариацию и число степеней свободы для нее.
Вычислите внутригрупповую вариацию и число степеней свободы для нее.
Задача № 16………………………………………………………………….. 5
Чтобы лучше распределять свое рабочее время, вы провели небольшое исследование, фиксируя время, затраченное на каждый
телефонный звонок (в минутах) в течение одного рабочего
дня. Перед тем как внести изменения в организацию своей ра¬боты (например, переадресовать некоторые звонки своим под¬чиненным), вы хотите разобраться в этой ситуации. Продолжи¬тельность звонков, сгруппированных по определенным темам, приведена в следующей таблице:
Информация Продажи Обслуживание Остальные
0,6 5,1 5,2 6, 3
1,1 1,7 2,9 1,2
1,0 4,4 2,6 3,1
1,9 26,6 1,2 2,5
3,8 7,4 7,0 3,0
1,6 1,4 14,2 2,6
0,4 7,0 8,4 0,8
0,6 3,9 0,6
2,2 3,1 26,7
12,3 1,2 7,7
4,2 1,9 4,8
2,8 17,3 7,2
1,4 7,8 2,7
4,3 3,4
3,4 13,3
1,3
2,0
1) Постройте в одном масштабе блочные диаграммы для этих четырех видов звонков и опишите полученную структуру.
2) Вычислите среднее и стандартное отклонения для ка¬ждого вида телефонных звонков.
3) Какой из типов звонков имеет наибольшую среднюю продолжительность, а какой наименьшую?
4) Выполняется ли для данного набора данных необходи¬мое для однофакторного дисперсионного анализа предположение о нормальном распределении и равной вариации? Почему?
5) Вычислите для каждого значения натуральный лога¬рифм и постройте блочные диаграммы для этих логарифмов.
6) Можно ли сказать, что предположение о равной ва¬риации лучше выполняется для логарифмов, чем для исходных данных?
Задача № 20………………………………………………………………….. 9
Проверяются различия качества сырья трех поставщиков на не¬котором производстве: Amalgamated (поставщик A), Bipolar (поставщик B) и Consolidated (поставщик C). Вам поручено собрать и проанализировать данные об этом качестве в виде его оценок 5- ю случайно выбранными работниками каждой из трех смен предприятия по 100-балльной шкале (оценка - неот¬рицательное целое число). Представьте, что данные собраны. Заполните ими следующую таблицу (у каждого решающего задачу - свои данные; заранее допустив значимые различия в качест¬ве сырья каких-то из поставщиков A, B, C, можно смоделиро¬вать эти различия исходными данными; можно обдумать причи¬ны, по которым оценки качества сырья взятого поставщика значимо разнятся в сменах, и смоделировать также действие этих причин):
Дневная смена Ночная смена Пересменка
A B C A B C A B C
Двухфакторный дисперсионный анализ качества продукции
Источник вариации DF SS MS F p
Смена
Поставщик
Смена X поставщик
Ошибка
Итого
1) Создайте таблицу средних значений качества для вы¬бранной комбинации поставщика и смены в виде
Дневная смена Ночная смена Пересменка Среднее
Поставщик A
Поставщик B
Поставщик C
Среднее
и выполните при помощи этой таблицы однофакторный дисперси¬онный анализ (ANOVA), выбрав в качестве признака средний показатель качества сырья в ячейке, а в качестве фактора - переменную «фирма-поставщик». Почему по этим данным нельзя выполнить двухфакторный дисперсионный анализ (убедитесь в этом в среде SPSS)?
2) В дополнение к проведенному однофакторному диспер¬сионному анализу (ANOVA) выполните множественный регресси¬онный анализ с индикаторными (фиктивными) переменными (см. тему «Множественная регрессия»). С этой целью создайте за¬висимую переменную Y, поместив средние в сменах оценки ка¬чества сырья в одном длинном столбце, например, для удобст¬ва ввода данных в алфавитном порядке по поставщику: сначала оценки сырья Amalgamated (поставщик A), затем Bipolar (по¬ставщик B) и, далее, Consolidated (поставщик C).
3) Далее, создайте две индикаторные переменные X1, X2 для введения в модель регрессии качественного предиктора «компания-поставщик», со следующей таблицей кодирования:
X₁ X2
Amalgamated 1 0
Bipolar 0 1
Consolidated 0 0
Постройте уравнение регрессии и проведите тестирование зна¬чимости влияния предиктора на зависимую переменную.
4) Сравните результат F- теста, полученный из регрес¬сионного анализа, с результатом F- теста, полученным из однофакторного дисперсионного анализа. Дают ли эти два метода — множественная регрессия и однофакторный дисперсионный анализ — разные результаты, или результаты полностью совпа¬дают? Как вы думаете, почему это именно так?
5) Сравните коэффициенты регрессии (наклоны) для ин¬дикаторных переменных в уравнении регрессии с разностями средних значений оценок качества для разных поставщиков (эти средние значения содержатся в последнем столбце «Сред¬нее» в таблице средних). Прокомментируйте полученный ре¬зультат.
6) Выполните двухфакторный дисперсионный анализ ис¬ходных данных и заполните соответствующую таблицу, приве¬денную выше. Прокомментируйте полученные результаты в ас¬пекте значимости влияния на показатели качества сырья фак¬торов «смена» и «поставщик» и их взаимодействия. Классифи-цируйте тип взаимодействия и проиллюстрируйте его графиче¬ски.
Задача № 26………………………………………………………………….. 14
Объедините размеры годовой заработной платы в три группы в
соответствии с уровнем квалификации служащих ( А, В и С) и
1) Для сравнения этих трех групп постройте блочные диаграммы и прокомментируйте их.
2) Найдите среднее значение для каждого уровня квали¬фикации и прокомментируйте его.
3) Найдите межгрупповую и внутригрупповую вариацию и соответствующие им степени свободы.
4) Найдите значение F — статистики и количество степе¬ней свободы для нее.
5) Выполните F — тест на уровне 0,05 и представьте ре¬зультаты.
6) Изложите результаты теста наименьшего значимого различия, если он может быть применен (тест наименьшего значимого различия - в точности то же, что и предусмотрен¬ный в SPSS сравнительный анализ влияния различных уровней фактора на исследуемый признак, см. Лекцию 2, стр.18 и при¬меры из Case Studies в SPSS).
7) Обобщите, что вы узнали из базы данных относитель¬но этой проблемы.
Задача № 35………………………………………………………………….. 17
Представьте себе, что данные в однофакторном эксперименте
распределены по четырем группам, каждая из которых состоит
из восьми элементов.
Заполните пропуски в приводимой ниже сводной таблице ANOVA, объяснив, чем в ней являются величины c и n .
Вид вариативно¬сти Количество степеней свободы Сумма квад-ратов Дисперсия F — статистика
Межгрупповая вариативность признака c -1 = ? SSA = ? MSA = 80 F = ?
Внутригрупповая вариативность признака n - c = ? SSW = 560 MSW = ?
Полная вариативность признака n -1 = ? SST = ?
Задача № 42………………………………………………………………….. 18
☼ Компания, производящая шариковые авторучки, наняла рек¬ламное агентство, чтобы организовать общенациональную рек¬ламную кампанию. Для начала директор компании решил иссле¬довать влияние рекламы на восприятие их продукции. Был ор¬ганизован эксперимент, в котором сравнивались пять видов рекламы шариковых авторучек. В рекламе А свойства авторучек были сильно занижены, в рекламе Б — занижены умеренно, в рекламе В — слегка преувеличены, в рекламе Г — сильно пре¬увеличены, и лишь в рекламе Д характеристики ручек описыва¬лись объективно. Из крупной фокус - группы была извлечена вы¬борка, в которую были включены 30 респондентов, случайным образом распределенные по пяти группам, соответствующим разным видам рекламы (по шесть человек в группе). Прочитав рекламное объявление и сформировав свое представление о продукции компании, респонденты получали авторучки одного и того же вида, испытывали их и оценивали достоверность рек¬ламных обещаний. Респондентов просили оценить внешний вид, долговечность и качество авторучек по семибалльной шкале. Суммарный рейтинг рекламы, учитывающий баллы по каждому из показателей (внешний вид, долговечность и качество), по¬ставленные каждым из 30 респондентов, приведены в файле ☼ PEN . XLS.
1) Существует ли статистически значимая разница между средними рейтингами разных рекламных объявлений, если уро¬вень значимости равен 0,05?
2) Определите, рейтинг какого рекламного объявления отличается от среднего, если это возможно.
3) Существует ли статистически значимая разница между дисперсиями рейтингов разных рекламных объявлений, если уровень значимости равен 0,05?
4) Как результат решения пункта 3 влияет на коррект¬ность результатов решения пунктов 1 и 2?
Задача № 44………………………………………………………………….. 20
Компания, производящая спортивные товары, желает сравнить расстояние, которое пролетают мячи для гольфа, изготовлен¬ные по четырем разным технологиям. По каждой технологии бы¬ло произведено по десять мячей. Затем эти мячи были переда¬ны местному гольф-клубу для испытаний. Порядок следования мячей был случайным. Все 40 мячей были испытаны в течение короткого отрезка времени при одинаковых погодных условиях. Результаты испытания (в ярдах) приведены в таблице:
Технология
1 2 3 4
206,32 203,81 217,08 213,90
226,77 223,85 230,55 231,10
207,94 206,75 221,43 221,28
224,79 223,97 227,95 221,53
206,19 205,68 218,04 229,43
229,75 234,30 231,84 235,45
204,45 204,49 224,13 213,54
228,51 219,50 224,87 228,35
209,65 210,86 211,82 214,51
221,44 233,00 229,49 225,09
1) Можно ли утверждать, что среднее расстояние, кото¬рое пролетают мячи для гольфа, произведенные по разным тех¬нологиям, неодинаково, если уровень значимости равен 0,05?
2) Если среднее расстояние, которое пролетают мячи для гольфа, произведенные по разным технологиям, неодинако¬во, примените процедуру Тьюки-Крамера и определите отличаю¬щиеся группы.
3) Какие условия должны выполняться при решении пунк¬та 1? Выполняются ли эти условия?
4) Какую технологию следует предпочесть? Обоснуйте свою рекомендацию.
Исходя из того, что тест Левенэ оказался значимым, мы сделали вывод о том, что дисперсии рейтингов разных рекламных сообщений равны, следовательно, результаты проведенного анализа корректны.
Задача № 45………………………………………………………………….. 22
Допустим, что при двухфакторном эксперименте факторы А и В имеют по три уровня. В каждой из девяти ячеек (cells), со¬ответствующих комбинациям уровней факторов А и В, находятся по четыре реплики.
1) Сколько степеней свободы существует при определе¬нии вариации фактора А?
2) Сколько степеней свободы существует при определе¬нии вариации фактора В?
3) Сколько степеней свободы существует при определе¬нии вариации взаимодействия факторов?
4) Сколько степеней свободы существует при определе¬нии вариации случайной ошибки?
5) Сколько степеней свободы существует при определе¬нии полной вариации?
Задача № 46………………………………………………………………….. 23
Рассмотрим эксперимент, описанный в задаче 45.
1) Предположим, что SSA = 120 , SSB = 110 , SSE = 270 и SST = 540. Чему равна величина SSAB?
2) Чему равна величина MSA?
3) Чему равна величина MSB?
4) Чему равна величина MSAB?
5) Чему равна величина MSE?
6) Чему равна F - статистика для эффекта взаимодейст¬вия?
7) Чему равна F- статистика для эффекта фактора А?
8) Чему равна F- статистика для эффекта фактора В?
9) Заполните сводную таблицу дисперсионного анализа.
Задача № 53………………………………………………………………….. 24
Студенты, изучающие статистику, провели факторный экспе¬римент, в ходе которого измерялось время растворения боле¬утоляющих таблеток в стакане воды. В эксперименте исследо¬вались два фактора: торговая марка (Equate, KROGER, Alka-Seltzer) и температура воды (теплая или холодная). Продолжительность растворения (в секундах) 24 таблеток приведены таблице, см. файл PAIN-RELIEF.XLS.
Торговая марка
Вода EQUATE KROGER ALKA-SELTZER
Холодная 85,87 75, 98 100,11
78, 69 87, 66 99, 65
76,42 85,71 100,83
74,43 86,31 94,16
Горячая 21,53 24,10 23,80
26,26 25,83 21,29
24, 95 26,32 20,82
21,52 22, 91 23,21
1) Существует ли статистически значимый эффект взаи¬модействия между разновидностью таблетки и временем ее рас¬творения, если уровень значит равен 0,05?
2) Существует ли статистически значимый эффект разно¬видности таблетки, если уровень значимости равен 0,05?
3) Существует ли статистически значимый эффект темпе¬ратуры воды, уровень значимости равен 0,05?
4) Постройте график средней продолжительности раство¬рения таблеток каждой разновидности при двух температурах воды.
5) Объясните результаты решения п.п. 1 и 3.
Задача № 55………………………………………………………………….. 27
В одном из экспериментов исследовалась прочность автомо¬бильных шин, зависящая от длины шипов и вида установки. Данные помещены в следующую таблицу (файл GEAR.XLS).
Установка
Длина шипов НИЗКАЯ ВЫСОКАЯ
Короткие
18,0 13,5
16,5 8,5
26,0 11,5
22,5 16, 0
21,5 -4,5
21,0 4,0
30,0 1,0
24,5 9,0
Длинные
27,5 17,5
19,5 11,5
31,0 10,0
27,0 1,0
17,0 14,5
14,0 3,5
18,0 7,5
17,5 6,5
1) Существует ли статистически значимый эффект взаи¬модействия между установкой шины и длиной шипов, если уро¬вень значимости равен 0,05?
2) Существует ли статистически значимое влияние длины шипов на прочность шины, если уровень значимости равен 0,05?
3) Существует ли статистически значимое влияние вида установки шины на ее прочность, если уровень значимости ра¬вен 0,05?
4) Постройте график средней прочности шин для каждого вида шипов при разных видах установки.
5) Объясните результаты решения п. п. 1-4.
Контрольная работа по дисциплине "Анализ данных"
Тема: «Дисперсионный анализ».
С подробным решением и графиками
Сдана на отлично
Текст задач в содержании
лекции
Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям
Контрольная работа по дисциплине "Анализ данных"
Тема: «Дисперсионный анализ».
С подробным решением и графиками
Сдана на отлично
Содержание
Задача № 5 …………………………………………………………………... 3
Запишите и прокомментируйте формулу для каждой из указанных ниже величин, которые используются в однофакторном дисперсионном анализе.
Общий размер выборки, n.
Общее (главное) среднее, Х ̅.
Межгрупповая вариация и соответствующее число степеней свободы.
Внутригрупповая вариация и соответствующее число степеней свободы.
F – статистика и соответствующее число степеней свободы.
F - таблица.
Задача № 7………………………………………………………………….. 4
Была осуществлена проверка трех рекламных акций. В каждом случае использовались разные случайные выборки потребителей из одного и того же города. Оценки характеризуют эффективность рекламы; результаты приведены в следующей таблице:
Реклама - 1 Реклама - 2 Реклама - 3
Среднее 63,2 68,1 53,5
Стандартное отклонение 7,9 11,3 9,2
Размер выборки (потребителей) 101 97 105
Какая реклама оказалась наиболее, а какая наименее эффективной?
Определите общий объем выборки, n, общее среднее, X ̅, и число выборок k.
Вычислите межгрупповую вариацию и число степеней свободы для нее.
Вычислите внутригрупповую вариацию и число степеней свободы для нее.
Задача № 16………………………………………………………………….. 5
Чтобы лучше распределять свое рабочее время, вы провели небольшое исследование, фиксируя время, затраченное на каждый
телефонный звонок (в минутах) в течение одного рабочего
дня. Перед тем как внести изменения в организацию своей ра¬боты (например, переадресовать некоторые звонки своим под¬чиненным), вы хотите разобраться в этой ситуации. Продолжи¬тельность звонков, сгруппированных по определенным темам, приведена в следующей таблице:
Информация Продажи Обслуживание Остальные
0,6 5,1 5,2 6, 3
1,1 1,7 2,9 1,2
1,0 4,4 2,6 3,1
1,9 26,6 1,2 2,5
3,8 7,4 7,0 3,0
1,6 1,4 14,2 2,6
0,4 7,0 8,4 0,8
0,6 3,9 0,6
2,2 3,1 26,7
12,3 1,2 7,7
4,2 1,9 4,8
2,8 17,3 7,2
1,4 7,8 2,7
4,3 3,4
3,4 13,3
1,3
2,0
1) Постройте в одном масштабе блочные диаграммы для этих четырех видов звонков и опишите полученную структуру.
2) Вычислите среднее и стандартное отклонения для ка¬ждого вида телефонных звонков.
3) Какой из типов звонков имеет наибольшую среднюю продолжительность, а какой наименьшую?
4) Выполняется ли для данного набора данных необходи¬мое для однофакторного дисперсионного анализа предположение о нормальном распределении и равной вариации? Почему?
5) Вычислите для каждого значения натуральный лога¬рифм и постройте блочные диаграммы для этих логарифмов.
6) Можно ли сказать, что предположение о равной ва¬риации лучше выполняется для логарифмов, чем для исходных данных?
Задача № 20………………………………………………………………….. 9
Проверяются различия качества сырья трех поставщиков на не¬котором производстве: Amalgamated (поставщик A), Bipolar (поставщик B) и Consolidated (поставщик C). Вам поручено собрать и проанализировать данные об этом качестве в виде его оценок 5- ю случайно выбранными работниками каждой из трех смен предприятия по 100-балльной шкале (оценка - неот¬рицательное целое число). Представьте, что данные собраны. Заполните ими следующую таблицу (у каждого решающего задачу - свои данные; заранее допустив значимые различия в качест¬ве сырья каких-то из поставщиков A, B, C, можно смоделиро¬вать эти различия исходными данными; можно обдумать причи¬ны, по которым оценки качества сырья взятого поставщика значимо разнятся в сменах, и смоделировать также действие этих причин):
Дневная смена Ночная смена Пересменка
A B C A B C A B C
Двухфакторный дисперсионный анализ качества продукции
Источник вариации DF SS MS F p
Смена
Поставщик
Смена X поставщик
Ошибка
Итого
1) Создайте таблицу средних значений качества для вы¬бранной комбинации поставщика и смены в виде
Дневная смена Ночная смена Пересменка Среднее
Поставщик A
Поставщик B
Поставщик C
Среднее
и выполните при помощи этой таблицы однофакторный дисперси¬онный анализ (ANOVA), выбрав в качестве признака средний показатель качества сырья в ячейке, а в качестве фактора - переменную «фирма-поставщик». Почему по этим данным нельзя выполнить двухфакторный дисперсионный анализ (убедитесь в этом в среде SPSS)?
2) В дополнение к проведенному однофакторному диспер¬сионному анализу (ANOVA) выполните множественный регресси¬онный анализ с индикаторными (фиктивными) переменными (см. тему «Множественная регрессия»). С этой целью создайте за¬висимую переменную Y, поместив средние в сменах оценки ка¬чества сырья в одном длинном столбце, например, для удобст¬ва ввода данных в алфавитном порядке по поставщику: сначала оценки сырья Amalgamated (поставщик A), затем Bipolar (по¬ставщик B) и, далее, Consolidated (поставщик C).
3) Далее, создайте две индикаторные переменные X1, X2 для введения в модель регрессии качественного предиктора «компания-поставщик», со следующей таблицей кодирования:
X₁ X2
Amalgamated 1 0
Bipolar 0 1
Consolidated 0 0
Постройте уравнение регрессии и проведите тестирование зна¬чимости влияния предиктора на зависимую переменную.
4) Сравните результат F- теста, полученный из регрес¬сионного анализа, с результатом F- теста, полученным из однофакторного дисперсионного анализа. Дают ли эти два метода — множественная регрессия и однофакторный дисперсионный анализ — разные результаты, или результаты полностью совпа¬дают? Как вы думаете, почему это именно так?
5) Сравните коэффициенты регрессии (наклоны) для ин¬дикаторных переменных в уравнении регрессии с разностями средних значений оценок качества для разных поставщиков (эти средние значения содержатся в последнем столбце «Сред¬нее» в таблице средних). Прокомментируйте полученный ре¬зультат.
6) Выполните двухфакторный дисперсионный анализ ис¬ходных данных и заполните соответствующую таблицу, приве¬денную выше. Прокомментируйте полученные результаты в ас¬пекте значимости влияния на показатели качества сырья фак¬торов «смена» и «поставщик» и их взаимодействия. Классифи-цируйте тип взаимодействия и проиллюстрируйте его графиче¬ски.
Задача № 26………………………………………………………………….. 14
Объедините размеры годовой заработной платы в три группы в
соответствии с уровнем квалификации служащих ( А, В и С) и
1) Для сравнения этих трех групп постройте блочные диаграммы и прокомментируйте их.
2) Найдите среднее значение для каждого уровня квали¬фикации и прокомментируйте его.
3) Найдите межгрупповую и внутригрупповую вариацию и соответствующие им степени свободы.
4) Найдите значение F — статистики и количество степе¬ней свободы для нее.
5) Выполните F — тест на уровне 0,05 и представьте ре¬зультаты.
6) Изложите результаты теста наименьшего значимого различия, если он может быть применен (тест наименьшего значимого различия - в точности то же, что и предусмотрен¬ный в SPSS сравнительный анализ влияния различных уровней фактора на исследуемый признак, см. Лекцию 2, стр.18 и при¬меры из Case Studies в SPSS).
7) Обобщите, что вы узнали из базы данных относитель¬но этой проблемы.
Задача № 35………………………………………………………………….. 17
Представьте себе, что данные в однофакторном эксперименте
распределены по четырем группам, каждая из которых состоит
из восьми элементов.
Заполните пропуски в приводимой ниже сводной таблице ANOVA, объяснив, чем в ней являются величины c и n .
Вид вариативно¬сти Количество степеней свободы Сумма квад-ратов Дисперсия F — статистика
Межгрупповая вариативность признака c -1 = ? SSA = ? MSA = 80 F = ?
Внутригрупповая вариативность признака n - c = ? SSW = 560 MSW = ?
Полная вариативность признака n -1 = ? SST = ?
Задача № 42………………………………………………………………….. 18
☼ Компания, производящая шариковые авторучки, наняла рек¬ламное агентство, чтобы организовать общенациональную рек¬ламную кампанию. Для начала директор компании решил иссле¬довать влияние рекламы на восприятие их продукции. Был ор¬ганизован эксперимент, в котором сравнивались пять видов рекламы шариковых авторучек. В рекламе А свойства авторучек были сильно занижены, в рекламе Б — занижены умеренно, в рекламе В — слегка преувеличены, в рекламе Г — сильно пре¬увеличены, и лишь в рекламе Д характеристики ручек описыва¬лись объективно. Из крупной фокус - группы была извлечена вы¬борка, в которую были включены 30 респондентов, случайным образом распределенные по пяти группам, соответствующим разным видам рекламы (по шесть человек в группе). Прочитав рекламное объявление и сформировав свое представление о продукции компании, респонденты получали авторучки одного и того же вида, испытывали их и оценивали достоверность рек¬ламных обещаний. Респондентов просили оценить внешний вид, долговечность и качество авторучек по семибалльной шкале. Суммарный рейтинг рекламы, учитывающий баллы по каждому из показателей (внешний вид, долговечность и качество), по¬ставленные каждым из 30 респондентов, приведены в файле ☼ PEN . XLS.
1) Существует ли статистически значимая разница между средними рейтингами разных рекламных объявлений, если уро¬вень значимости равен 0,05?
2) Определите, рейтинг какого рекламного объявления отличается от среднего, если это возможно.
3) Существует ли статистически значимая разница между дисперсиями рейтингов разных рекламных объявлений, если уровень значимости равен 0,05?
4) Как результат решения пункта 3 влияет на коррект¬ность результатов решения пунктов 1 и 2?
Задача № 44………………………………………………………………….. 20
Компания, производящая спортивные товары, желает сравнить расстояние, которое пролетают мячи для гольфа, изготовлен¬ные по четырем разным технологиям. По каждой технологии бы¬ло произведено по десять мячей. Затем эти мячи были переда¬ны местному гольф-клубу для испытаний. Порядок следования мячей был случайным. Все 40 мячей были испытаны в течение короткого отрезка времени при одинаковых погодных условиях. Результаты испытания (в ярдах) приведены в таблице:
Технология
1 2 3 4
206,32 203,81 217,08 213,90
226,77 223,85 230,55 231,10
207,94 206,75 221,43 221,28
224,79 223,97 227,95 221,53
206,19 205,68 218,04 229,43
229,75 234,30 231,84 235,45
204,45 204,49 224,13 213,54
228,51 219,50 224,87 228,35
209,65 210,86 211,82 214,51
221,44 233,00 229,49 225,09
1) Можно ли утверждать, что среднее расстояние, кото¬рое пролетают мячи для гольфа, произведенные по разным тех¬нологиям, неодинаково, если уровень значимости равен 0,05?
2) Если среднее расстояние, которое пролетают мячи для гольфа, произведенные по разным технологиям, неодинако¬во, примените процедуру Тьюки-Крамера и определите отличаю¬щиеся группы.
3) Какие условия должны выполняться при решении пунк¬та 1? Выполняются ли эти условия?
4) Какую технологию следует предпочесть? Обоснуйте свою рекомендацию.
Исходя из того, что тест Левенэ оказался значимым, мы сделали вывод о том, что дисперсии рейтингов разных рекламных сообщений равны, следовательно, результаты проведенного анализа корректны.
Задача № 45………………………………………………………………….. 22
Допустим, что при двухфакторном эксперименте факторы А и В имеют по три уровня. В каждой из девяти ячеек (cells), со¬ответствующих комбинациям уровней факторов А и В, находятся по четыре реплики.
1) Сколько степеней свободы существует при определе¬нии вариации фактора А?
2) Сколько степеней свободы существует при определе¬нии вариации фактора В?
3) Сколько степеней свободы существует при определе¬нии вариации взаимодействия факторов?
4) Сколько степеней свободы существует при определе¬нии вариации случайной ошибки?
5) Сколько степеней свободы существует при определе¬нии полной вариации?
Задача № 46………………………………………………………………….. 23
Рассмотрим эксперимент, описанный в задаче 45.
1) Предположим, что SSA = 120 , SSB = 110 , SSE = 270 и SST = 540. Чему равна величина SSAB?
2) Чему равна величина MSA?
3) Чему равна величина MSB?
4) Чему равна величина MSAB?
5) Чему равна величина MSE?
6) Чему равна F - статистика для эффекта взаимодейст¬вия?
7) Чему равна F- статистика для эффекта фактора А?
8) Чему равна F- статистика для эффекта фактора В?
9) Заполните сводную таблицу дисперсионного анализа.
Задача № 53………………………………………………………………….. 24
Студенты, изучающие статистику, провели факторный экспе¬римент, в ходе которого измерялось время растворения боле¬утоляющих таблеток в стакане воды. В эксперименте исследо¬вались два фактора: торговая марка (Equate, KROGER, Alka-Seltzer) и температура воды (теплая или холодная). Продолжительность растворения (в секундах) 24 таблеток приведены таблице, см. файл PAIN-RELIEF.XLS.
Торговая марка
Вода EQUATE KROGER ALKA-SELTZER
Холодная 85,87 75, 98 100,11
78, 69 87, 66 99, 65
76,42 85,71 100,83
74,43 86,31 94,16
Горячая 21,53 24,10 23,80
26,26 25,83 21,29
24, 95 26,32 20,82
21,52 22, 91 23,21
1) Существует ли статистически значимый эффект взаи¬модействия между разновидностью таблетки и временем ее рас¬творения, если уровень значит равен 0,05?
2) Существует ли статистически значимый эффект разно¬видности таблетки, если уровень значимости равен 0,05?
3) Существует ли статистически значимый эффект темпе¬ратуры воды, уровень значимости равен 0,05?
4) Постройте график средней продолжительности раство¬рения таблеток каждой разновидности при двух температурах воды.
5) Объясните результаты решения п.п. 1 и 3.
Задача № 55………………………………………………………………….. 27
В одном из экспериментов исследовалась прочность автомо¬бильных шин, зависящая от длины шипов и вида установки. Данные помещены в следующую таблицу (файл GEAR.XLS).
Установка
Длина шипов НИЗКАЯ ВЫСОКАЯ
Короткие
18,0 13,5
16,5 8,5
26,0 11,5
22,5 16, 0
21,5 -4,5
21,0 4,0
30,0 1,0
24,5 9,0
Длинные
27,5 17,5
19,5 11,5
31,0 10,0
27,0 1,0
17,0 14,5
14,0 3,5
18,0 7,5
17,5 6,5
1) Существует ли статистически значимый эффект взаи¬модействия между установкой шины и длиной шипов, если уро¬вень значимости равен 0,05?
2) Существует ли статистически значимое влияние длины шипов на прочность шины, если уровень значимости равен 0,05?
3) Существует ли статистически значимое влияние вида установки шины на ее прочность, если уровень значимости ра¬вен 0,05?
4) Постройте график средней прочности шин для каждого вида шипов при разных видах установки.
5) Объясните результаты решения п. п. 1-4.
Контрольная работа по дисциплине "Анализ данных"
Тема: «Дисперсионный анализ».
С подробным решением и графиками
Сдана на отлично
Текст задач в содержании
лекции
Купить эту работу vs Заказать новую | ||
---|---|---|
0 раз | Куплено | Выполняется индивидуально |
Не менее 40%
Исполнитель, загружая работу в «Банк готовых работ» подтверждает, что
уровень оригинальности
работы составляет не менее 40%
|
Уникальность | Выполняется индивидуально |
Сразу в личном кабинете | Доступность | Срок 1—5 дней |
2000 ₽ | Цена | от 200 ₽ |
Не подошла эта работа?
В нашей базе 51749 Контрольных работ — поможем найти подходящую