Лабораторная работа №4. «Построение парной линейной модели регрессии с использованием инструмента «Регрессия» MS EXCEL

Модульная единица 3.

Требования к содержанию, оформлению и порядку выполнения:

 

Для успешного выполнения работы студенты должны знать материал лекции по теме «Статистическая оценка достоверности выборочных показателей связи».

Теоретическая часть.

 

Как известно из курса математической статистики нулевая гипотеза принимается, если фактическое значение критерия не превышает его критическое значение при выбранном уровне его (теоретического значения критерия) значимости. С другой стороны, если известна значимость фактического значения критерия (выводится при реализации инструмента «Регрессия» MS EXCEL), тогда статистический вывод нужно делать следующим образом:

1) задать теоретический уровень значимости (наиболее часто применяются уровни – 1%, 5%, 0,01%)

2) сравнить фактическую значимость с теоретической:

если < – принимается альтернативная,

– нулевая гипотеза.

В регрессионном анализе при проверке значимости уравнения в целом или его параметров в качестве нулевой гипотезы выдвигается предположение об их недостоверности – равенстве нулю коэффициента корреляции (при оценке значимости уравнения в целом) или параметров. Следовательно, параметры или уравнение в целом будут значимы, только в том случае, если < .

Одним из показателей качества модели является средняя ошибка аппроксимации:

,

 

где - рассчитанные по уравнению регрессии прогнозные (предсказанные значения) для каждого значения независимой переменной.

Для прогнозирования считается приемлемым уровень средней ошибки аппроксимации 8-10%.

 

Общая постановка задачи. Используя встроенный инструмент «Регрессия» MS EXCEL, построить парную линейную модель регрессии, оценить результаты.

 

Индивидуальные данные представлены в файле «исходные данные.exl» на листе «парная регрессия».

 

Пример и методические указания к выполнению работы.

 

Требуется по исходным данным лабораторных работ №2 «Парный корреляционно-регрессионный анализ» и №3 «Оценка достоверности параметров и уравнения регрессии в целом» построить уравнение линейной регрессии с использованием встроенного инструмента «Регрессия». Проверить правильность расчетов, проведенных в лабораторной работе №2 и №3.

Методические указания.

Исходные данные должны быть расположены в столбцах, причем первый столбец – у, второй – х (рис. 1).

 

Рис. 1. Исходные данные

 

Для построения модели парной линейной регрессии выберите инструмент анализа Регрессия (пункт Главного меню Сервис →Анализ данных →Регрессия) и нажмите ОК (рис. 2). В появившемся окне «Регрессия» щелкните флажок напротив «Входной интервал У:» и выделите соответствующий числовой диапазон данных, аналогично заполните «Входной интервал Х:», поставьте галочку «Остатки» и нажмите «ОК».

 

Рис. 2. Инструмент Регрессия

В итоге появится новый лист со следующей информацией (рис.3):

 

Рис. 3. Регрессия, вывод итогов

 

Вывод:

В результате использования инструмента «Регрессия» получены те же параметры уравнения, ошибки, значения критериев F, t, получены аналогичные интервальные оценки для параметров в генеральной совокупности.

Уравнение регрессии: ỹ=18,3+0,004х. Уравнение в целом значимо F=32,5, а значимость критерия (Значимость F на листе итогов) составила 0,0002*100=0,02%, что гораздо меньше обычно принимаемой 5% области (если значимость критерия находится в пределах выбранной исследователем критической области, в нашем случае 5%, то принимается альтернативная гипотеза, если больше – нулевая), следовательно, уравнение будет значимо для генеральной совокупности.

Значим параметр а: P-Значение для критерия t-Стьюдента (t-Статистика) составило 0,007 (0,7%<5%, следовательно принимается На). Коэффициент полной регрессии оказался также значимым (0,02%<5%), возможна его интерпретация: при увеличении (уменьшении) инвестиций в расчете на душу населения на 1 рубль валовой региональный продукт на душу населения увеличится (уменьшится) на 4 рубля.

Поскольку параметры выборочного уравнения регрессии значимы, то можно дать интервальную оценку параметров генерального уравнения. Нижние и верхние границы параметров на листе вывода итогов обозначены как «Нижние 95%» и «Верхние95%».

Параметр α находится в пределах от 6,1 до 30,5: 6,1≤α ≤30,5; параметр β: 0,003≤β≤0,006 при уровне доверия данных суждений 95%.

Оценим тесноту связи между переменными. Коэффициент корреляции r=0,874, что свидетельствует о сильной тесноте связи, коэффициент детерминации позволяет сделать вывод, что 76,5% вариации ВВП связано с изменением уровня инвестиций в расчете на душу населения.

Поскольку получено значимое уравнение по критерию Фишера, с высоким коэффициентом детерминации, значимыми параметрами, то можно сделать вывод о достаточно высоком качестве модели и возможности построения прогнозов на ее основе.

Чтобы подтвердить данный вывод рассчитаем еще один показатель качества модели среднюю ошибку аппроксимации (рис. 4).

 

Для прогнозирования считается приемлемым уровень средней ошибки аппроксимации 8-10%.

 

Рис. 4. Расчет средней ошибки аппроксимации

 

Вывод:В нашем случае ошибка составила 17,1%, но поскольку коэффициент детерминации достаточно высок, то на основе полученного уравнения можно сделать прогноз.

Контрольные вопросы к защите

1) Каковы возможности встроенных инструментов EXCEL для проведения регрессионного анализа?

2) Какой показатель парного корреляционно-регрессионного анализа в EXCEL назван «R-квадрат»?

3) Какие показатели обозначены «SS», «MS» ?

4) Как принять или отклонить нулевую гипотезу о незначимости уравнения регрессии, используя результаты реализации инструмента «Регрессия»?

5) Как оценить значимость параметров уравнения регрессии, используя результаты реализации инструмента «Регрессия»?

6) Как провести точечную и интервальную оценку параметров уравнения регрессии, используя результаты реализации инструмента «Регрессия»?

7) Что понимается под «Предсказанным Y» ?

8) Каково понятие остатка?

9) Как и с какой целью рассчитывается средняя ошибка аппроксимации?

10) Каким образом рассчитать среднюю ошибку аппроксимации, используя результаты реализации инструмента «Регрессия»

 

 

Способ оценки результатов

№ п/п Элементы выполнения работы и усвоения теоретического материала Максимальный балл
Расчетная часть работы выполнена корректно и полностью
Сделаны подробные выводы, в которых отражены выявленные закономерности
Защита работы
Итого х