Лабораторная работа №2. «Парный корреляционно-регрессионный анализ»

Модульная единица 2.

Требования к содержанию, оформлению и порядку выполнения:

 

Для успешного выполнения работы студенты должны знать материал лекции по теме «Парная линейная регрессия»

Теоретическая часть.

Форма связи между двумя экономическими переменными может быть установлена графическим методом, для этого строится поле корреляции и оценивается рассеяние наблюдений.

Параметры уравнения парной линейной регрессии могут быть оценены методом наименьших квадратов, согласно которому:

;

,

где ;

;

;

( );

n – число наблюдений (в данном примере n= 12), i меняется от 1 до n.

 

Оценка тесноты связи оценивается с использованием коэффициентов корреляции ( ) и детерминации ( – квадрат коэффициента корреляции). Коэффициент корреляции может быть определен двумя способами:

1) ;

2) .

Коэффициент детерминации является показателем качества модели.

Общая постановка задачи. Используя средства MS EXCEL построить парную линейную модель регрессии, рассчитать показатели тесноты связи по индивидуальным данным.

 

 

Индивидуальные данные представлены в файле «исходные данные.exl» на листе «парная регрессия»

 

Пример и методические указания к выполнению работы.

Условие. Имеются данные по 12 регионам Российской Федерации о валовом региональном продукте (ВРП) и инвестициях в основной капитал в расчете на душу населения, представленные в виде электронной таблицы в MS EXCEL (рис. 1).

1. Исходные данные

 

Требуется построить регрессионную модель зависимости ВРП от уровня инвестиций на душу населения, рассчитать показатели тесноты связи между признаками, используя средства MS EXCEL.

Методические указания.

1. Постановка проблемы. Уровень ВРП в расчете на душу населения является основным показателем эффективности экономики региона, уровня жизни населения. Аналогом данного показателя на уровне страны является валовой внутренний продукт (ВВП), увеличение которого является общенациональной задачей.

2. Информационной базой являются данные по 12 регионам РФ из 89. Исследуемая совокупность регионов является выборкой. Число наблюдений является достаточным для построения лишь парной модели (на каждый фактор, включенный в модель, по мнению разных исследователей, должно приходиться от 6-7 до 10 наблюдений).

3. Спецификация модели (отбор факторов и установление формы связи между ними).

Из экономической теории известно, что основным фактора роста уровня производства ВВП (ВРП) является повышение уровня инвестиций. Проверим на эмпирических данных его справедливость для современных условий. Для этого построим парную модель связи уровня ВРП (у) с инвестициями в основной капитал (х) в расчете на душу населения.

Форму связи между переменными установим графическим методом. Построим поле корреляции, используя Мастер диаграмм. Для этогощелкните пиктограмму на панели инструментов – в результате появится окно:

 

Выберите точечную диаграмму и нажмите кнопку «Далее», на втором шаге, возможно, EXCEL попытается автоматически определить диапазон данных. Прейдите на вкладку «Ряд» – появиться окно:

 

 

нажмите кнопку «Добавить»:

 

 

 

Выберите значения х и у. После нажатия «Далее» появиться следующее окно:

На вкладке «Заголовки» подпишите оси, добавьте название диаграммы. На вкладке «Легенда» снимите флажок «Добавить легенду», щелкнув мышкой, и нажмите «Готово»:

 

Построенный график позволяет предположить, что связь между результативным и факторным признаком является линейной. В итоге получаем выборочную модель парной линейной регрессии:

.

4. Найдем параметры модели методом наименьших квадратов, согласно которому:

;

,

где ;

;

;

( );

n – число наблюдений (в данном примере n= 12), i меняется от 1 до n.

Кроме того, рассчитаем ( ), которая нам понадобиться в дальнейшем для определения показателей тесноты связи.

Таким образом, нам необходимо рассчитать средние , для чего сначала нужно найти суммы , а затем поделить каждую из них на n (рис.2).

На рис. 2 средние получены в 17 строке путем деления сумм в строке 16 на n= 12.

 

Рис. 2. Расчетные данные

 

В строке 18 рассчитаны дисперсии и .

В строке 19 определены , с использованием формулы «= корень()» , так как .

В строках 20 и 21 определены параметры уравнения, в итоге получено выборочное уравнение связи:

.

Сделаем вывод: коэффициент полной регрессии (0,00437) показывает, что если увеличить инвестиции на 1 рубль в расчете на душу населения, то ВРП на следующий год увеличится на 0,00437*1000=4,37 рубля.

Для оценки тесноты связи рассчитаем коэффициенты корреляции ( ) и детерминации ( – квадрат коэффициента корреляции). Коэффициент корреляции определим двумя способами:

1) ;

2) .

Коэффициент корреляции, определенный двумя способами, равен 0,87, что свидетельствует о сильной корреляционной связи между изучаемыми признаками. Коэффициент детерминации равен 0,87*0,87=0,76, т.е. 76 % (0,76*100=76 ) вариации ВРП на душу населения зависит от факторного признака – инвестиций в основной капитал прошлого года в расчете на душу населения. Таким образом, мы подтвердили эмпирическим путем зависимость ВРП от инвестиций.

Контрольные вопросы к защите

1. Каковы основные этапы построения эконометрической модели?

2. Понятие уравнения регрессии.

3. Что понимают под спецификацией модели?

4. Каковы способы определения формы связи между переменными?

5. Сущность метода наименьших квадратов.

6. Способы определения коэффициента регрессии.

7. Интерпретация параметров парного линейного уравнения регрессии.

8. Коэффициент детерминации: интерпретация и способ расчета.

9. Какова связь между ковариацией и коэффициентом корреляции?

10. Какова связь между коэффициентом полной регрессии и коэффициентом

корреляции?

 

 

Способ оценки результатов

№ п/п Элементы выполнения работы и усвоения теоретического материала Максимальный балл
Расчетная часть работы выполнена корректно и полностью
Сделаны подробные выводы, в которых отражены выявленные закономерности
Защита работы
Соблюдение сроков защиты
Итого х