Матрица парных коэффициентов корреляций. Анализ матрицы коэффициентов парной корреляции

Экономические данные представляют собой количественные характеристики каких-либо экономических объектов или процессов. Они формируются под действием множества факторов, не все из которых доступны внешнему контролю. Неконтролируемые факторы могут принимать случайные значения из некоторого множества значений и тем самым обусловливать случайность данных, которые они определяют. Одной из основных задач в экономических исследованиях является анализ зависимостей между переменными.

Рассматривая зависимости между признаками, необходимо выделить прежде всего два типа связей:

функциональные - характеризуются полным соответствием между изменением факторного признака и изменением результативной величины: каждому значению признака-фактора соответствуют вполне определенные значения результативного признака. Этот тип связи выражается в виде формульной зависимости. Функциональная зависимость может связывать результативный признак с одним или несколькими факторными признаками. Так, величина заработной платы при повременной оплате труда зависит от количества отработанных часов;
корреляционные - между изменением двух признаков нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем, при массовом наблюдении фактических данных. Одновременное воздействие на изучаемый признак большого количества разнообразных факторов приводит к тому, что одному и тому же значению признака-фактора соответствует целое распределение значений результативного признака, поскольку в каждом конкретном случае прочие факторные признаки могут изменять силу и направленность своего воздействия.

Следует иметь в виду, что при наличии функциональной зависимости между признаками можно, зная величину факторного признака, точно определить величину результативного признака. При наличии же корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака.

Изучая взаимосвязи между признаками, их классифицируют по направлению, форме, числу факторов:

по направлению связи делятся на прямые и обратные. При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора. При обратной связи направление изменения результативного признака противоположно направлению изменения признака- фактора. Например, чем выше квалификация рабочего, тем выше уровень производительности его труда (прямая связь). Чем выше производительность труда, тем ниже себестоимость единицы продукции (обратная связь);
по форме (виду функции) связи делят на линейные (прямолинейные) и нелинейные (криволинейные). Линейная связь отображается прямой линией, нелинейная - кривой (парабол ой, гиперболой и т.п.). При линейной связи с возрастанием значения факторного признака происходит равномерное возрастание (убывание) значения результативного признака;
по количеству факторов, действующих на результативный признак, связи подразделяют на однофакторные (парные) и многофакторные.

Изучение зависимости вариации признака от окружающих условий и составляет содержание теории корреляции .

При проведении корреляционного анализа вся совокупность данных рассматривается как множество переменных (факторов), каждая из которых содержит п наблюдений.

При изучении взаимосвязи между двумя факторами их, как правило, обозначают Х= (х р х 2 , ...,х п) и Y= (у { , у 2 , ...,у и).

Ковариация - это статистическая мера взаимодействия двух переменных. Например, положительное значение ковариации доходности двух ценных бумаг показывает, что доходности этих ценных бумаг имеют тенденцию изменяться в одну сторону.

Ковариация между двумя переменными X и Y рассчитывается следующим образом:

где- фактические значения переменных

X и г;

Если случайные величины Хи Y независимы, теоретическая ковариация равна нулю.

Ковариация зависит от единиц, в которых измеряются переменные Хи У, она является ненормированной величиной. Поэтому для измерения силы связи между двумя переменными используется другая статистическая характеристика, называемая коэффициентом корреляции.

Для двух переменных X и Y коэффициент парной корреляции

определяется следующим образом:

где SSy - оценки дисперсий величин Хи Y. Эти оценки характеризуют степень разброса значений х { ,х 2 , ...,х п (у 1 ,у 2 ,у п) вокруг своего среднего х (у соответственно), или вариабельность (изменчивость) этих переменных на множестве наблюдений.

Дисперсия (оценка дисперсии) определяется по формуле

В общем случае для получения несмещенной оценки дисперсии сумму квадратов следует делить на число степеней свободы оценки (п-р), где п - объем выборки, р - число наложенных на выборку связей. Так как выборка уже использовалась один раз для определения среднего X, то число наложенных связей в данном случае равно единице (р = 1), а число степеней свободы оценки (т.е. число независимых элементов выборки) равно (п - 1).

Более естественно измерять степень разброса значений переменных в тех же единицах, в которых измеряется и сама переменная. Эту задачу решает показатель, называемый среднеквадратическим отклонением (стандартным отклонением ) или стандартной ошибкой переменной X (переменной Y) и определяемый соотношением

Слагаемые в числителе формулы (3.2.1) выражают взаимодействие двух переменных и определяют знак корреляции (положительная или отрицательная). Если, например, между переменными существует сильная положительная взаимосвязь (увеличение одной переменной при увеличении второй), каждое слагаемое будет положительным числом. Аналогично, если между переменными существует сильная отрицательная взаимосвязь, все слагаемые в числителе будут отрицательными числами, что в результате дает отрицательное значение корреляции.

Знаменатель выражения для коэффициента парной корреляции [см. формулу (3.2.2)] просто нормирует числитель таким образом, что коэффициент корреляции оказывается легко интерпретируемым числом, не имеющим размерности, и принимает значения от -1 до +1.

Числитель выражения для коэффициента корреляции, который трудно интерпретировать из-за необычных единиц измерения, есть ковариация ХиУ. Несмотря на то что иногда она используется как самостоятельная характеристика (например, в теории финансов для описания совместного изменения курсов акций на двух биржах), удобнее пользоваться коэффициентом корреляции. Корреляция и ковариация представляют, по сути, одну и ту же информацию, однако корреляция представляет эту информацию в более удобной форме.

Для качественной оценки коэффициента корреляции применяются различные шкалы, наиболее часто - шкала Чеддока. В зависимости от значения коэффициента корреляции связь может иметь одну из оценок:

0,1-0,3 - слабая;
0,3-0,5 - заметная;
0,5-0,7 - умеренная;
0,7-0,9 - высокая;
0,9-1,0 - весьма высокая.

Оценка степени тесноты связи с помощью коэффициента корреляции проводится, как правило, на основе более или менее ограниченной информации об изучаемом явлении. В связи с этим возникает необходимость оценки существенности линейного коэффициента корреляции, дающая возможность распространить выводы по результатам выборки на генеральную совокупность.

Оценка значимости коэффициента корреляции при малых объемах выборки выполняется с использованием 7-критерия Стьюдента. При этом фактическое (наблюдаемое) значение этого критерия определяется по формуле

Вычисленное по этой формуле значение / набл сравнивается с критическим значением 7-критерия, которое берется из таблицы значений /-критерия Стьюдента (см. Приложение 2) с учетом заданного уровня значимости ос и числа степеней свободы (п - 2).

Если 7 набл > 7 табл, то полученное значение коэффициента корреляции признается значимым (т.е. нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). И таким образом делается вывод, что между исследуемыми переменными есть тесная статистическая взаимосвязь.

Если значение г у х близко к нулю, связь между переменными слабая. Если корреляция между случайными величинами:

положительная, то при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать;
отрицательная, то при возрастании одной случайной величины другая имеет тенденцию в среднем убывать. Удобным графическим средством анализа парных данных является диаграмма рассеяния , которая представляет каждое наблюдение в пространстве двух измерений, соответствующих двум факторам. Диаграмму рассеяния, на которой изображается совокупность значений двух признаков, называют еще корреляционным полем. Каждая точка этой диаграммы имеет координаты х (. и у г По мере того как возрастает сила линейной связи, точки на графике будут лежать более близко к прямой линии, а величина г будет ближе к единице.

Коэффициенты парной корреляции используются для измерения силы линейных связей различных пар признаков из их множества. Для множества признаков получают матрицу коэффициентов парной корреляции.

Пусть вся совокупность данных состоит из переменной Y = = (у р у 2 , ..., у п) и т переменных (факторов) X, каждая из которых содержит п наблюдений. Значения переменных Y и X, содержащиеся в наблюдаемой совокупности, записываются в таблицу (табл. 3.2.1).

Таблица 3.2.1

Переменная Номер наблюдения


					Х тЗ

					Х тп

На основании данных, содержащихся в этой таблице, вычисляют матрицу коэффициентов парной корреляции R, она симметрична относительно главной диагонали:

Анализ матрицы коэффициентов парной корреляции используют при построении моделей множественной регрессии.

Одной корреляционной матрицей нельзя полностью описать зависимости между величинами. В связи с этим в многомерном корреляционном анализе рассматривается две задачи:

1. Определение тесноты связи одной случайной величины с совокупностью остальных величин, включенных в анализ.
2. Определение тесноты связи между двумя величинами при фиксировании или исключении влияния остальных величин.

Эти задачи решаются соответственно с помощью коэффициентов множественной и частной корреляции.

Решение первой задачи (определение тесноты связи одной случайной величины с совокупностью остальных величин, включенных в анализ) осуществляется с помощью выборочного коэффициента множественной корреляции по формуле

где R - R [см. формулу (3.2.6)]; Rjj - алгебраическое дополнение элемента той же матрицы R.

Квадрат коэффициента множественной корреляции Щ j 2 j _j J+l m принято называть выборочным множественным коэффициентом детерминации ; он показывает, какую долю вариации (случайного разброса) исследуемой величины Xj объясняет вариация остальных случайных величин Х { , Х 2 ,..., Х т.

Коэффициенты множественной корреляции и детерминации являются величинами положительными, принимающими значения в интервале от 0 до 1. При приближении коэффициента R 2 к единице можно сделать вывод о тесноте взаимосвязи случайных величин, но не о ее направлении. Коэффициент множественной корреляции может только увеличиваться, если в модель включать дополнительные переменные, и не увеличится, если исключать какие-либо из имеющихся признаков.

Проверка значимости коэффициента детерминации осуществляется путем сравнения расчетного значения /’-критерия Фишера

с табличным F raбл. Табличное значение критерия (см. Приложение 1) определяется заданным уровнем значимости а и степенями свободы v l = mnv 2 = n-m-l. Коэффициент R 2 значимо отличается от нуля, если выполняется неравенство

Если рассматриваемые случайные величины коррелируют друг с другом, то на величине коэффициента парной корреляции частично сказывается влияние других величин. В связи с этим возникает необходимость исследования частной корреляции между величинами при исключении влияния других случайных величин (одной или нескольких).

Выборочный частный коэффициент корреляции определяется по формуле

где R Jk , Rjj, R kk - алгебраические дополнения к соответствующим элементам матрицы R [см. формулу (3.2.6)].

Частный коэффициент корреляции, также как и парный коэффициент корреляции, изменяется от -1 до +1.

Выражение (3.2.9) при условии т = 3 будет иметь вид

Коэффициент г 12(3) называется коэффициентом корреляции между х { и х 2 при фиксированном х у Он симметричен относительно первичных индексов 1, 2. Его вторичный индекс 3 относится к фиксированной переменной.

Пример 3.2.1. Вычисление коэффициентов парной,

множественной и частной корреляции.

В табл. 3.2.2 представлена информация об объемах продаж и затратах на рекламу одной фирмы, а также индекс потребительских расходов за ряд текущих лет.

1. Построить диаграмму рассеяния (корреляционное поле) для переменных «объем продаж» и «индекс потребительских расходов».
2. Определить степень влияния индекса потребительских расходов на объем продаж (вычислить коэффициент парной корреляции).
3. Оценить значимость вычисленного коэффициента парной корреляции.
4. Построить матрицу коэффициентов парной корреляции по трем переменным.
5. Найти оценку множественного коэффициента корреляции.
6. Найти оценки коэффициентов частной корреляции.

1. В нашем примере диаграмма рассеяния имеет вид, приведенный на рис. 3.2.1. Вытянутость облака точек на диаграмме рассеяния вдоль наклонной прямой позволяет сделать предположение, что существует некоторая объективная тенденция прямой линейной связи между значениями переменных Х 2 Y (объем продаж).

Рис. 3.2.1.

2. Промежуточные расчеты при вычислении коэффициента корреляции между переменными Х 2 (индекс потребительских расходов) и Y (объем продаж) приведены в табл. 3.2.3.

Средние значения случайных величин Х 2 и Y, которые являются наиболее простыми показателями, характеризующими последовательности jCj, х 2 , ..., х 16 и y v y 2 , ..., у 16 , рассчитаем по следующим формулам:

Объем продаж Y, тыс. руб.	Индекс потреби тельских расходов	Объем продаж Y, тыс. руб.	Индекс потреби тельских расходов

Таблица 3.2.3

л:, - х	(И - У)(х, - х)	(х, - х) 2	(у,- - у) 2

Дисперсия характеризует степень разброса значений x v x 2 ,х :

Рассмотрим теперь решение примера 3.2.1 в Excel.

Чтобы вычислить корреляцию средствами Excel, можно воспользоваться функцией =коррел (), указав адреса двух столбцов чисел, как показано на рис. 3.2.2. Ответ помещен в D8 и равен 0,816.

Рис. 3.2.2.

(Примечание. Аргументы функции коррел должны быть числами или именами, массивами или ссылками, содержащими числа. Если аргумент, который является массивом или ссылкой, содержит текст, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.

Если массив! и массив2 имеют различное количество точек данных, то функция коррел возвращает значение ошибки #н/д.

Если массив1 либо массив2 пуст или если о (стандартное отклонение) их значений равно нулю, то функция коррел возвращает значение ошибки #дел/0 !.)

Критическое значение /-статистики Стьюдента может быть также получено с помощью функции стьюдраспробр 1 пакета Excel. В качестве аргументов функции необходимо задать число степеней свободы, равное п - 2 (в нашем примере 16 - 2= 14) и уровень значимости а (в нашем примере а = 0,1) (рис. 3.2.3). Если фактическое значение /-статистики, взятое по модулю, больше критического, то с вероятностью (1 - а) коэффициент корреляции значимо отличается от нуля.

Рис. 3.2.3. Критическое значение /-статистики равно 1,7613

В Excel входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения различных статистических задач. Для вычисления матрицы коэффициентов парной корреляции R следует воспользоваться инструментом Корреляция (рис. 3.2.4) и установить параметры анализа в соответствующем диалоговом окне. Ответ будет помещен на новый рабочий лист (рис. 3.2.5).

1 В Excel 2010 название функции стьюдраспробр изменено на стью-

ДЕНТ.ОБР.2Х.

Рис. 3.2.4.

Рис. 3.2.5.

Основоположниками теории корреляции считаются английские статистики Ф. Гальтон (1822-1911) и К. Пирсон (1857-1936). Термин «корреляция» был заимствован из естествознания и обозначает «соотношение, соответствие». Представление о корреляции как взаимозависимости между случайными переменными величинами лежит воснове математико-статистической теории корреляции.

Коллинеарными являются факторы …

Решение:

Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . В нашей модели только коэффициент парной линейной регрессии между факторами и больше 0,7. , значит, факторы и коллинеарны.

4. В модели множественной регрессии определитель матрицы парных коэффициентов корреляции между факторами , и близок к нулю. Это означает, что факторы , и …

мультиколлинеарны

независимы

количественно измеримы

Решение:

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Если факторы не коррелированы между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной. Поскольку все недиагональные элементы были бы равны нулю.
, поскольку = = и = = =0.
Если между факторами существует полная линейная зависимость и все коэффициенты парной корреляции равны единице, то определитель такой матрицы равен нулю.

Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.

5. Для эконометрической модели линейного уравнения множественной регрессии вида построена матрица парных коэффициентов линейной корреляции (y – зависимая переменная; х (1) , х (2) , х (3) , x (4) – независимые переменные):

Коллинеарными (тесно связанными) независимыми (объясняющими) переменными не являются …

x (2) и x (3)

x (1) и x (3)

x (1) и x (4)

x (2) и x (4)

Решение:

При построении модели множественной регрессии необходимо исключить возможность существования тесной линейной зависимости между независимыми (объясняющими) переменными, которая ведет к проблеме мультиколлинеарности. При этом осуществляют проверку коэффициентов линейной корреляции для каждой пары независимых (объясняющих) переменных. Эти значения отражены в матрице парных коэффициентов линейной корреляции. Считается, что наличие значений коэффициентов парной корреляции между объясняющими переменными, превышающих по абсолютной величине 0,7, отражает тесную связь между этими переменными (теснота связи с переменной y в данном случае не рассматривается). Такие независимые переменные называются коллинеарными. Если значение коэффициента парной корреляции между объясняющими переменными не превышает по абсолютной величине 0,7, то такие объясняющие переменные не являются коллинеарными. Рассмотрим значения парных коэффициентов межфакторной корреляции: между x (1) и x (2) значение равно 0,45; между x (1) и x (3) – равно 0,82; между x (1) и x (4) – равно 0,94; между x (2) и x (3) – равно 0,3; между x (2) и x (4) – равно 0,7; между x (3) и x (4) – равно 0,12. Таким образом, не превышают 0,7 значения , , . Следовательно, коллинеарными не являются факторы x (1) и x (2) , x (2) и x (3) , x (3) и x (4) . Из последних перечисленных пар в вариантах ответов присутствует пара x (2) и x (3) – это верный вариант ответа. Для остальных пар: x (1 и x (3) , x (1) и x (4) , x (2) и x (4) – значения парных коэффициентов межфакторной корреляции превышают 0,7, и эти факторы являются коллинеарными.

Тема 3: Фиктивные переменные

1. Дана таблица исходных данных для построения эконометрической регрессионной модели:

Фиктивными переменными не являются …

стаж работы

производительность труда

уровень образования

уровень квалификации работника

Решение:

При построении регрессионной модели может возникнуть ситуация, когда необходимо включить в уравнение помимо количественных переменных переменные, отражающие некоторые атрибутивные признаки (пол, образование, регион и т.п.). Такого рода качественные переменные называются «фиктивными» (dummy) переменными. Для построения указанной в постановке задания модели используются фиктивные переменные: уровень образования и уровень квалификации работника. Остальные переменные не являются фиктивными, из предложенных вариантов это стаж работы и производительность труда.

2. При исследовании зависимости потребления мяса от уровня дохода и пола потребителя можно рекомендовать …

использовать фиктивную переменную – пол потребителя

разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола

использовать фиктивную переменную – уровень дохода

исключить из рассмотрения пол потребителя, так как данный фактор нельзя измерить количественным образом

Решение:

При построении регрессионной модели может возникнуть ситуация, когда необходимо включить в уравнение помимо количественных переменных переменные, отражающие некоторые атрибутивные признаки (пол, образование, регион и т.п.). Такого рода качественные переменные называются «фиктивными» (dummy) переменными. Они отражают неоднородность исследуемой статистической совокупности и используются для более качественного моделирования зависимостей в таких неоднородных объектах наблюдения. При моделировании отдельных зависимостей по неоднородным данным можно также воспользоваться способом разделения всей совокупности неоднородных данных на несколько отдельных совокупностей, количество которых равно количеству состояний dummy-переменной. Таким образом правильными вариантами ответов являются: «использовать фиктивную переменную – пол потребителя» и «разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола».

3. Изучается зависимость цены квартиры (у ) от ее жилой площади (х ) и типа дома. В модель включены фиктивные переменные, отражающие рассматриваемые типы домов: монолитный, панельный, кирпичный. Получено уравнение регрессии: ,
где ,
Частными уравнениями регрессии для кирпичного и монолитного являются …

для типа дома кирпичный

для типа дома монолитный

для типа дома кирпичный

для типа дома монолитный

Решение:

Требуется узнать частное уравнение регрессии для кирпичного и монолитного домов. Для кирпичного дома значения фиктивных переменных следующие , . Уравнение примет вид: или для типа дома кирпичный.
Для монолитного дома значения фиктивных переменных следующие , . Уравнение примет вид
или для типа дома монолитный.

Z 1 (t)

Z 2 (t)

t

y(t)

Z 1 (t)

Z 2 (t)

t

y(t)

Основная задача, стоящая при выборе факторов включаемых в корреляционную модель, заключается в том, чтобы ввести в анализ все основные факторы, влияющие на уровень изучаемого явления. Однако, введение в модель большого числа факторов нецелесообразно, правильнее отобрать только сравнительно небольшое число основных факторов, находящихся предположительно в корреляционной зависимости с выбранным функциональным показателем.
Это можно сделать с помощью так называемого двух стадийного отбора. В соответствии с ним в модель включаются все предварительно отобранные факторы. Затем среди них на основе специальной количественной оценки и дополнительно качественного анализа выявляются несущественно влияющие факторы, которые постепенно отбрасываются пока не останутся те, относительно которых можно утверждать, что имеющийся статистический материал согласуется с гипотезой об их совместном существенном влиянии на зависимую переменную при выбранной форме связи.
Свое наиболее законченное выражение двух стадийный отбор получил в методике так называемого многошагового регрессионного анализа, при котором отсев несущественных факторов происходит на основе показателей их значимости, в частности на основе величины t ф - расчетном значении критерия Стьюдента.
Рассчитаем t ф по найденным коэффициентам парной корреляции и сравним их с t критическим для 5% уровня значимости (двустороннего) и 18 степенями свободы (ν = n-2).
где r – значение коэффициента парной корреляции;
n – число наблюдений (n=20)
При сравнении t ф для каждого коэффициента с t кр = 2,101 получаем, что найденные коэффициенты признаются значимыми, т.к. t ф > t кр.
t ф для r yx 1 = 2, 5599 ;
t ф для r yx 2 = 7,064206 ;
t ф для r yx 3 = 2,40218 ;
t ф для r х1 x 2 = 4,338906 ;
t ф для r х1 x 3 = 15,35065;
t ф для r х2 x 3 = 4,749981
При отборе факторов включаемых в анализ к ним предъявляются специфические требования. Прежде всего, показатели, выражающие эти факторы должны быть количественно измеримы.
Факторы, включаемые в модель, не должны находиться между собой в функциональной или близкой к ней связи. Наличие таких связей характеризуется мультиколлинеарностью.
Мультиколлинеарность свидетельствует о том, что некоторые факторы характеризуют одну и ту же сторону изучаемого явления. Поэтому их одновременное включение в модель нецелесообразно, так как они в определённой степени дублируют друг друга. Если нет особых предположений говорящих в пользу одного из этих факторов, следует отдавать предпочтение тому из них, который характеризуется большим коэффициентом парной (или частной) корреляции.
Считается, что предельным является значение коэффициента корреляции между двумя факторами, равное 0,8.
Мультиколлинеарность обычно приводит к вырождению матрицы переменных и, следовательно, к тому, что главный определитель уменьшает свое значение и в пределе становится близок к нулю. Оценки коэффициентов уравнения регрессии становятся сильно зависимыми от точности нахождения исходных данных и резко изменяют свои значения при изменении количества наблюдений.

Матрица парных коэффициентов корреляции
Y X1 X2 X3 X4 X5
Y
X1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
X4 0,667343 0,924333 0,70069 0,299583
X5 0,709204 0,940488 0,691809 0,326602 0,992945
В узлах матрицы находятся парные коэффициенты корреляции, характеризующие тесноту взаимосвязи между факторными признаками. Анализируя эти коэффициенты, отметим, что чем больше их абсолютная величина, тем большее влияние оказывает соответствующий факторный признак на результативный. Анализ полученной матрицы осуществляется в два этапа:

1. Если в первом столбце матрицы есть коэффициенты корреляции, для которых /r / < 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Анализируя парные коэффициенты корреляции факторных признаков друг с другом, (r XiXj), характеризующие тесноту их взаимосвязи, необходимо оценить их независимость друг от друга, поскольку это необходимое условие для дальнейшего проведения регрессионного анализа. В виду того, что в экономике абсолютно независимых признаков нет, необходимо выделить, по возможности, максимально независимые. Факторные признаки, находящиеся в тесной корреляционной зависимости друг с другом, называются мультиколлинеарными. Включение в модель мультиколлинеарных признаков делает невозможным экономическую интерпретацию регрессионной модели, так как изменение одного фактора влечет за собой изменение факторов с ним связанных, что может привести к «поломке» модели в целом.

Критерий мультиколлениарности факторов выглядит следующим образом:

/r XiXj / > 0,8

В полученной матрице парных коэффициентов корреляции этому критерию отвечают два показателя, находящиеся на пересечении строк и . Из каждой пары этих признаков в модели необходимо оставить один, он должен оказывать большее влияние на результативный признак. В итоге из модели исключаются факторы и , т.е. коэффициент роста себестоимости реализованной продукции и коэффициент роста объёма её реализации.

Итак, в регрессионную модель вводим факторы Х1 и Х2.

Далее осуществляется регрессионный анализ (сервис, анализ данных, регрессия). Вновь составляет таблица исходных данных с факторами Х1 и Х2. Регрессия в целом используется для анализа воздействия на отдельную зависимую переменную значений независимых переменных (факторов) и позволяет корреляционную связь между признаками представить в виде некоторой функциональной зависимости называемой уравнением регрессии или корреляционно-регрессионной моделью.

В результате регрессионного анализа получаем результаты расчета многомерной регрессии. Проанализируем полученные результаты.

Все коэффициенты регрессии значимы по критерию Стьюдента. Коэффициент множественной корреляции R составил 0,925, квадрат этой величины (коэффициент детерминации) означает, что вариация результативного признака в среднем на 85,5% объясняется за счет вариации факторных признаков, включенных в модель. Коэффициент детерминированности характеризует тесноту взаимосвязи между совокупностью факторных признаков и результативным показателем. Чем ближе значение R-квадрат к 1, тем теснее взаимосвязь. В нашем случае показатель, равный 0,855, указывает на правильный подбор факторов и на наличие взаимосвязи факторов с результативным показателем.

Рассматриваемая модель адекватна, поскольку расчетное значение F-критерия Фишера существенно превышает его табличное значение (F набл =52,401; F табл =1,53).

В качестве общего результата проведенного корреляционно-регрессионного анализа выступает множественное уравнение регрессии, которое имеет вид:

Полученное уравнение регрессии отвечает цели корреляционно-регрессионного анализа и является линейной моделью зависимости балансовой прибыли предприятия от двух факторов: коэффициента роста производительности труда и коэффициента имущества производственного назначения.

На основании полученной модели можно сделать вывод о том, что при увеличении уровня производительности труда на 1% к уровню предыдущего периода величина балансовой прибыли возрастет на 0,95 п.п.; увеличение же коэффициента имущества производственного назначения на 1% приведет к росту результативного показателя на 27,9 п.п. Слелдовательно, доминирующее влияние на рост балансовой прибыли оказывает увеличение стоимости имущества производственного назначения (обновление и рост основных средств предприятия).

По множественной регрессионной модели выполняется многофакторный прогноз результативного признака. Пусть известно, что Х1 = 3,0, а Х3 = 0,7. Подставим значения факторных признаков в модель, получим Упр = 0,95*3,0 + 27,9*0,7 – 19,4 = 2,98. Таким образом, при увеличении производительности труда и модернизации основных средств на предприятии балансовая прибыль в 1 квартале 2005 г. по отношению к предыдущему периоду (IV квартал 2004 г.) возрастет на 2,98%.

Множественная регрессия не является результатом преобразования уравнения:
-
;
-
.
Линеаризация подразумевает процедуру …
- приведения уравнения множественной регрессии к парной;
+ приведения нелинейного уравнения к линейному виду;
- приведения линейного уравнения к нелинейному виду;
- приведения нелинейного уравнения относительно параметров к уравнению, линейному относительно результата.
Остатки не изменяются;
Уменьшается количество наблюдений
В стандартизованном уравнении множественной регрессии переменными являются:
Исходные переменные;
Стандартизованные параметры;
Средние значения исходных переменных;
Стандартизованные переменные.
Одним из методов присвоения числовых значений фиктивным переменным является. . .
+– ранжирование;
Выравнивание числовых значений по возрастанию;
Выравнивание числовых значений по убыванию;
Нахождение среднего значения.
В матрице парных коэффициентов корреляции отображены значения парных коэффициентов линейной корреляции между. . . .
Переменными;
Параметрами;
Параметрами и переменными;
Переменными и случайными факторами.
Метод оценки параметров моделей с гетероскедастичными остатками называется ____________ методом наименьших квадратов:
Обычным;
Косвенным;
Обобщенным;
Минимальным.
Дано уравнение регрессии . Определите спецификацию модели.
Полиномиальное уравнение парной регрессии;
Линейное уравнение простой регрессии;
Полиномиальное уравнение множественной регрессии;
Линейное уравнение множественной регрессии.
В стандартизованном уравнении свободный член ….
Равен 1;
Равен коэффициенту множественной детерминации;
Равен коэффициенту множественной корреляции;
Отсутствует.
В качестве фиктивных переменных в модель множественной регрессии включаются факторы,
Имеющие вероятностные значения;
Имеющие количественные значения;
Не имеющие качественных значений;
Не имеющие количественных значений.
Факторы эконометрической модели являются коллинеарными, если коэффициент …
Корреляции между ними по модулю больше 0,7;
Детерминации между ними по модулю больше 0,7;
Детерминации между ними по модулю меньше 0,7;
Обобщенный метод наименьших квадратов отличается от обычного МНК тем, что при применении ОМНК …
Преобразуются исходные уровни переменных;
Остатки не изменяются;
Остатки приравниваются к нулю;
Уменьшается количество наблюдений.
Объем выборки определяется …
Числовыми значением переменных, отбираемых в выборку;
Объемом генеральной совокупности;
Числом параметров при независимых переменных;
Числом результативных переменных.
11. Множественная регрессия не является результатом преобразования уравнения:
+-
;
-
;
-
.
Исходные значения фиктивных переменных предполагают значения …
Качественные;
Количественно измеримые;
Одинаковые;
Значения.
Обобщенный метод наименьших квадратов подразумевает …
Преобразование переменных;
Переход от множественной регрессии к парной;
Линеаризацию уравнения регрессии;
Двухэтапное применение метода наименьших квадратов.
Линейное уравнение множественной регрессии имеет вид . Определите какой из факторовили:
+- , так как 3,7>2,5;
Оказывают одинаковое влияние;
- , так как 2,5>-3,7;
По этому уравнению нельзя ответить на поставленный вопрос, так как коэффициенты регрессии несравнимы между собой.
Включение фактора в модель целесообразно, если коэффициент регрессии при этом факторе является …
Нулевым;
Незначимым;
Существенным;
Несущественным.
Что преобразуется при применении обобщенного метода наименьших квадратов?
Стандартизованные коэффициенты регрессии;
Дисперсия результативного признака;
Исходные уровни переменных;
Дисперсия факторного признака.
Проводится исследование зависимости выработки работника предприятия от ряда факторов. Примером фиктивной переменной в данной модели будет являться ______ работника.
Возраст;
Уровень образования;
Заработная плата.
Переход от точечного оценивания к интервальному возможен, если оценки являются:
Эффективными и несостоятельными;
Неэффективными и состоятельными;
Эффективными и несмещенными;
Состоятельными и смещенными.
Матрица парных коэффициентов корреляции строится для выявления коллинеарных и мультиколлинеарных …
Параметров;
Случайных факторов;
Существенных факторов;
Результатов.
На основании преобразования переменных при помощи обобщенного метода наименьших квадратов получаем новое уравнение регрессии, которое представляет собой:
Взвешенную регрессию, в которой переменные взяты с весами
;
;
Нелинейную регрессию, в которой переменные взяты с весами
;
Взвешенную регрессию, в которой переменные взяты с весами .
Если расчетное значение критерия Фишера меньше табличного значения, то гипотеза о статистической незначимости уравнения …
Отвергается;
Незначима;
Принимается;
Несущественна.
Если факторы входят в модель как произведение, то модель называется:
Суммарной;
Производной;
Аддитивной;
Мультипликативной.
Уравнение регрессии, которое связывает результирующий признак с одним из факторов при зафиксированных на среднем уровне значении других переменных, называется:
Множественным;
Существенным;
Частным;
Несущественным.
Относительно количества факторов, включенных в уравнение регрессии, различают …
Линейную и нелинейную регрессии;
Непосредственную и косвенную регрессии;
Простую и множественную регрессию;
Множественную и многофакторную регрессию.
Требованием к уравнениям регрессии, параметры которых можно найти при помощи МНК является:
Равенство нулю значений факторного признака4
Нелинейность параметров;
Равенство нулю средних значений результативной переменной;
Линейность параметров.
Метод наименьших квадратов не применим для …
Линейных уравнений парной регрессии;
Полиномиальных уравнений множественной регрессии;
Уравнений, нелинейных по оцениваемым параметрам;
Линейных уравнений множественной регрессии.
При включении фиктивных переменных в модель им присваиваются …
Нулевые значения;
Числовые метки;
Одинаковые значения;
Качественные метки.
Если между экономическими показателями существует нелинейная связь, то …
Нецелесообразно использовать спецификацию нелинейного уравнения регрессии;
Целесообразно использовать спецификацию нелинейного уравнения регрессии;
Целесообразно использовать спецификацию линейного уравнение парной регрессии;
Необходимо включить в модель другие факторы и использовать линейное уравнение множественной регрессии.
Результатом линеаризации полиномиальных уравнений является …
Нелинейные уравнения парной регрессии;
Линейные уравнения парной регрессии;
Нелинейные уравнения множественной регрессии;
Линейные уравнения множественной регрессии.
В стандартизованном уравнении множественной регрессии
0,3;
-2,1. Определите, какой из факторовилиоказывает более сильное влияние на:
+- , так как 2,1>0,3;
По этому уравнению нельзя ответить на поставленный вопрос, так как неизвестны значения «чистых» коэффициентов регрессии;
- , так как 0,3>-2,1;
По этому уравнению нельзя ответить на поставленный вопрос, так как стандартизированные коэффициенты несравнимы между собой.
Факторные переменные уравнения множественной регрессии, преобразованные из качественных в количественные называются …
Аномальными;
Множественными;
Парными;
Фиктивными.
Оценки параметров линейного уравнения множественной регрессии можно найти при помощи метода:
Средних квадратов;
Наибольших квадратов;
Нормальных квадратов;
Наименьших квадратов.
Основным требованием к факторам, включаемым в модель множественной регрессии, является:
Отсутствие взаимосвязи между результатом и фактором;
Отсутствие взаимосвязи между факторами;
Отсутствие линейной взаимосвязи между факторами;
Наличие тесной взаимосвязи между факторами.
Фиктивные переменные включаются в уравнение множественной регрессии для учета действия на результат признаков …
Качественного характера;
Количественного характера;
Несущественного характера;
Случайного характера.
Из пары коллинеарных факторов в эконометрическую модель включается тот фактор,
Который при достаточно тесной связи с результатом имеет наибольшую связь с другими факторами;
Который при отсутствии связи с результатом имеет максимальную связь с другими факторами;
Который при отсутствии связи с результатом имеет наименьшую связь с другими факторами;
Который при достаточно тесной связи с результатом имеет меньшую связь с другими факторами.
Гетероскедастичность подразумевает …
Постоянство дисперсии остатков независимо от значения фактора;
Зависимость математического ожидания остатков от значения фактора;
Зависимость дисперсии остатков от значения фактора;
Независимость математического ожидания остатков от значения фактора.
Величина остаточной дисперсии при включении существенного фактора в модель:
Не изменится;
Будет увеличиваться;
Будет равно нулю;
Будет уменьшаться.
Если спецификация модели отображает нелинейную форму зависимости между экономическими показателями, то нелинейно уравнение …
Регрессии;
Детерминации;
Корреляции;
Аппроксимации.
Исследуется зависимость, которая характеризуется линейным уравнением множественной регрессии. Для уравнения рассчитано значение тесноты связи результативной переменной с набором факторов. В качестве этого показателя был использован множественный коэффициент …
Корреляции;
Эластичности;
Регрессии;
Детерминации.
Строится модель зависимости спроса от ряда факторов. Фиктивной переменной в данном уравнении множественной регрессии не является _________потребителя.
Семейное положение;
Уровень образования;
Для существенного параметра расчетное значение критерия Стьюдента …
Больше табличного значения критерия;
Равно нулю;
Не больше табличного значения критерия Стьюдента;
Меньше табличного значения критерия.
Систему МНК, построенную для оценки параметров линейного уравнения множественной регрессии можно решить …
Методом скользящего среднего;
Методом определителей;
Методом первых разностей;
Симплекс-методом.
Показатель, характеризующий на сколько сигм изменится в среднем результат при изменении соответствующего фактора на одну сигму, при неизменном уровне других факторов, называется ____________коэффициентом регрессии
Стандартизованным;
Нормализованным;
Выровненным;
Центрированным.
Мультиколлинеарность факторов эконометрической модели подразумевает …
Наличие нелинейной зависимости между двумя факторами;
Наличие линейной зависимости между более чем двумя факторами;
Отсутствие зависимости между факторами;
Наличие линейной зависимости между двумя факторами.
Обобщенный метод наименьших квадратов не используется для моделей с _______ остатками.
Автокоррелированными и гетероскедастичными;
Гомоскедастичными;
Гетероскедастичными;
Автокоррелированными.
Методом присвоения числовых значений фиктивным переменным не является:
Ранжирование;
Присвоение цифровых меток;
Нахождения среднего значения;
Присвоение количественных значений.
Нормально распределенных остатков;
Гомоскедастичных остатков;
Автокорреляции остатков;
Автокорреляции результативного признака.
Отбор факторов в модель множественной регрессии при помощи метода включения основан на сравнении значений …
Общей дисперсии до и после включения фактора в модель;
Остаточной дисперсии до и после включения случайных факторов в модель;
Дисперсии до и после включения результата в модель;
Остаточной дисперсии до и после включения фактора модель.
Обобщенный метод наименьших квадратов используется для корректировки …
Параметров нелинейного уравнения регрессии;
Точности определения коэффициента множественной корреляции;
Автокорреляции между независимыми переменными;
Гетероскедастичности остатков в уравнении регрессии.
После применения обобщенного метода наименьших квадратов удается избежать_________ остатков
Гетероскедастичности;
Нормального распределения;
Равенства нулю суммы;
Случайного характера.
Фиктивные переменные включаются в уравнения ____________регрессии
Случайной;
Парной;
Косвенной;
Множественной.
Взаимодействие факторов эконометрической модели означает, что …
Влияние факторов на результирующий признак зависит от значений другого неколлинеарного им фактора;
Влияние факторов на результирующий признак усиливается, начиная с определенного уровня значений факторов;
Факторы дублируют влияние друг друга на результат;
Влияние одного из факторов на результирующий признак не зависит от значений другого фактора.
Тема Множественная регрессия (Задачи)
Уравнение регрессии, построенное по 15 наблюдениям, имеет вид:
Пропущенные значения, а также доверительный интервал для
с вероятностью 0,99 равны:
Уравнение регрессии, построенное по 20 наблюдениям, имеет вид:
с вероятностью 0,9 равны:
Уравнение регрессии, построенное по 16 наблюдениям, имеет вид:
Пропущенные значения, а также доверительный интервал для с вероятностью 0,99 равны:
Уравнение регрессии в стандартизированном виде имеет вид:
Частные коэффициенты эластичности равны:
Стандартизованное уравнение регрессии имеет вид:
Частные коэффициенты эластичности равны:
Стандартизованное уравнение регрессии имеет вид:
Частные коэффициенты эластичности равны:
Стандартизованное уравнение регрессии имеет вид:
Частные коэффициенты эластичности равны:
Стандартизованное уравнение регрессии имеет вид:
Частные коэффициенты эластичности равны:
По 18 наблюдениям получены следующие данные:
;
;
;
;
равны:
По 17 наблюдениям получены следующие данные:
;
;
;
;
Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:
По 22 наблюдениям получены следующие данные:
;
;
;
;
Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:
По 25 наблюдениям получены следующие данные:
;
;
;
;
Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:
По 24 наблюдениям получены следующие данные:
;
;
;
;
Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:
По 28 наблюдениям получены следующие данные:
;
;
;
;
Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:
По 26 наблюдениям получены следующие данные:
;
;
;
;
Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:
В уравнении регрессии:
Восстановить пропущенные характеристики; построить доверительный интервал для с вероятностью 0,95, еслиn=12

КАТЕГОРИИ