Лабораторная работа №7. Исследование модели множественной регрессии на мультиколлинеарность. Расчет и оценка значимости коэффициентов частной корреляции.

Модульная единица 5.2.

Требования к содержанию, оформлению и порядку выполнения:

 

Для успешного выполнения работы студенты должны знать материал лекции по теме «Множественная и частная корреляция. Предпосылки МНК»

Теоретическая часть.

Мультиколлинеарность – высокая взаимная коррелированность объясняющих переменных – приводит к значительным ошибкам оцениваемых параметров и недостоверности параметров выборочного уравнения регрессии для генеральной совокупности.

Поэтому следствием мультиколлинеарности могут являтся:

1) незначимость большинства или всех оценок множественной регрессии по t-критерию при значимости уравнения в целом по F-критерию ;

2) при незначительном изменении исходных данных (увеличении (сокращении) числа наблюдений) оценки существенно изменяются;

3) трудность (невозможность) интерпретации параметров регрессии с экономической точки зрения.

Точных количественных критериев для определения мультиколлинеарности не существует. Но если в модели присутствуют перечисленные выше признаки, то можно предположить что факторы связаны тесной корреляционной связью.

Одним из подходов по выявлению мультиколлинеарности является анализ матрицы парных коэффициентов корреляции. При этом, если , то уже в этом случае можно говорить о коллинеарности факторов.

Выборочным частным коэффициентом корреляции (частным коэффициентом корреляции) между переменными xi и xj при фиксированных значениях остальных (p-2) переменных называется выражение:

,

где через q обозначены алгебраические дополнения, например:

- алгебраическое дополнение, а - минор (определитель матрицы парных коэффициентов корреляции, получаемый при вычеркивании i-той строки и j-го столбца).

В случае трех переменных:

.

Частные коэффициенты можно найти через остаточные объемы вариации: ,

где - остаточный объем вариации при построении модели регрессии зависимой переменной i от всего набора (р-1) переменных;

- остаточный объем вариации модели регрессии зависимой переменной i от (р-2) набора переменных (за исключением j).

В случае трех переменных: .

Кроме того, существует еще один способ расчета:

 

– в общем виде:

.

в случае трех переменных:

.

 

Общая постановка задачи. Используя средства MS EXCEL построить множественную линейную модель регрессии, рассчитать показатели тесноты связи по индивидуальным данным.

Индивидуальные данные представлены в файле «исходные данные.exl» на листе «множественная регрессия»

Пример и методические указания к выполнению работы.

 

Условие: имеется выборочная модель множественной регрессии (лабораторная работа № 6 «Построение модели множественной линейной регрессии»).

Требуется:

1) проверить модель на коллинеарность факторов х1 и х2;

2) рассчитать выборочные коэффициенты частной корреляции , , , используя четыре способа. Оценить их значимость, сравнить с парными коэффициентами , , , объяснить причины различий.

Методические указания.

Одним из подходов по выявлению мультиколлинеарности является анализ матрицы парных коэффициентов корреляции. При этом, если , то уже в этом случае можно говорить о коллинеарности факторов.

Построим матрицу парных коэффициентов корреляции, используя встроенный инструмент «Корреляция»:

  Валовой региональный продукт, тыс. руб., (у) Инвестиции в основной капитал, руб., (х1) Уровень экономической активности населения, %, (х2)
Валовой региональный продукт, тыс. руб., (у) 1,0000    
Инвестиции в основной капитал, руб., (х1) 0,8745 1,0000  
Уровень экономической активности населения, %, (х2) 0,6809 0,3464 1,0000

 

В нашем случае коэффициент свидетельствует о слабой коррелированности факторов. Поэтому можно сделать заключение об отсутствии коллинеарности факторов. К тому же все параметры регрессии оказались значимыми для генеральной совокупности (см. предыдущую работу).

Для оценки коллинеарности факторов, а также для выявления «чистого» взаимодействия рассчитывают коэффициенты частной корреляции.