Что показывает множественный коэффициент корреляции
Перейти к содержимому

Что показывает множественный коэффициент корреляции

  • автор:

Множественный коэффициент корреляции

Множественный коэффициент корреляции — Характеризует тесноту линейной корреляционной связи между одной случайной величиной и некоторым множеством случайных величин. Более точно, если (ξ12. ξk) — случайный вектор из R k , тогда коэффициент множественной корреляции ρ ξ 1 ∙ ξ 2 , … , ξ k \bullet \xi _,\ldots ,\xi _>> между ξ1 и ξ2. ξk численно равен коэффициенту парной линейной корреляции между величиной ξ1 и её наилучшей линейной аппроксимацией M ( ξ 1 | ξ 2 , … , ξ k ) |\xi _,\ldots ,\xi _)> по переменным ξ2. ξk, которая представляет собой линейную регрессию ξ1 на ξ2. ξk.

Oops something went wrong:

Множественный коэффициент корреляции и множественный коэффициент детерминации

Множественный коэффициент корреляции используется в качестве меры степени тесноты статистической связи между результирующим показателем (зависимой переменной) y и набором объясняющих (независимых) переменных или, иначе говоря, оценивает тесноту совместного влияния факторов на результат.

Множественный коэффициент корреляции может быть вычислен по ряду формул 5 , в том числе:

  • с использованием матрицы парных коэффициентов корреляции

, (3.18) где r — определитель матрицы парных коэффициентов корреляции y,, r11 — определитель матрицы межфакторной корреляции ;

  • стандартизованных коэффициентов регрессии и парных коэффициентов корреляции

. (3.19) Для модели, в которой присутствуют две независимые переменные, формула (3.18) упрощается . (3.20) Квадрат множественного коэффициента корреляции равен коэффициенту детерминацииR 2 . Как и в случае парной регрессии, R 2 свидетельствует о качестве регрессионной модели и отражает долю общей вариации результирующего признака y, объясненную изменением функции регрессии f(x) (см. 2.4). Кроме того, коэффициент детерминации может быть найден по формуле . (3.21) Однако использование R 2 в случае множественной регрессии является не вполне корректным, так как коэффициент детерминации возрастает при добавлении регрессоров в модель. Это происходит потому, что остаточная дисперсия уменьшается при введении дополнительных переменных. И если число факторов приблизится к числу наблюдений, то остаточная дисперсия будет равна нулю, и коэффициент множественной корреляции, а значит и коэффициент детерминации, приблизятся к единице, хотя в действительности связь между факторами и результатом и объясняющая способность уравнения регрессии могут быть значительно ниже. Для того чтобы получить адекватную оценку того, насколько хорошо вариация результирующего признака объясняется вариацией нескольких факторных признаков, применяют скорректированный коэффициент детерминации(3.22) Скорректированный коэффициент детерминации всегда меньше R 2 . Кроме того, в отличие от R 2 , который всегда положителен, может принимать и отрицательное значение. Пример (продолжение примера 1). Рассчитаем множественный коэффициент корреляции, согласно формуле (3.20): =0,8601. Величина множественного коэффициента корреляции, равного 0,8601, свидетельствует о сильной взаимосвязи стоимости перевозки с весом груза и расстоянием, на которое он перевозится. Коэффициент детерминации равен: R 2 =0,7399. Скорректированный коэффициент детерминации рассчитываем по формуле (3.22): =0,7092. Заметим, что величина скорректированного коэффициента детерминации отличается от величины коэффициента детерминации. Таким образом, 70,9% вариации зависимой переменной (стоимости перевозки) объясняется вариацией независимых переменных (весом груза и расстоянием перевозки). Остальные 29,1% вариации зависимой переменной объясняются факторами, неучтенными в модели. Величина скорректированного коэффициента детерминации достаточно велика, следовательно, мы смогли учесть в модели наиболее существенные факторы, определяющие стоимость перевозки. 

МНОЖЕСТВЕННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

— мера линейной зависимости между одной и нек-рой совокупностью случайных величин. Точнее, если случайный вектор со значениями в , то М. к. к. между определяется как обычный коэффициент корреляции между Х 1 и наилучшим линейным приближением по т. е. регрессией величины по . М. к. к. обладает тем свойством, что если при есть регрессия по то среди всех линейных комбинаций величин величина имеет наибольшую корреляцию с ; в этом смысле М. к. к.- частный случай канонич. коэффициента корреляции. При к -2 М. к. к. равен обычному коэффициенту корреляции между . М. к. к. между обозначается и выражается через элементы корреляционной матрицы следующим образом

где — определитель алгебраич. дополнение элемента ; при этом . Если , то величина Х 1 с вероятностью 1 равна нек-рой линейной комбинации величин т. е. совместное распределение величин сосредоточено в нек-рой гиперплоскости пространства . С другой стороны,тогда и только тогда, когда т. е. когда не коррелирована ни с одной из величин Для вычисления М. к. к. можно также использовать формулу где — дисперсия , а — дисперсия X1 относительно регрессии.

Выборочным аналогом М. к. к. является

где и — оценки и по выборке объема п. Для проверки гипотезы об отсутствии связи используются выборочные распределения . При условии, что выборка произведена из многомерной нормальной совокупности, величина имеет бета-распределение с параметрами , если ; если , то величина при имеет в пределе нецентральное «хи-квадрат»-распределение с к-1 степенями свободы и параметром нецентральности

Лит.:[1] Крамер Г., Математические методы статистики, пер. с англ., 2 изд., М., 1975; [2] Кендалл М., Стьюарт А., Статистические выводы и связи, пер. с англ., М., 1973.

А. В. Прохоров.

Математическая энциклопедия. — М.: Советская энциклопедия . И. М. Виноградов . 1977—1985 .

  • МНОЖЕСТВЕННОЕ СРАВНЕНИЕ
  • МНОЖЕСТВО

53.1. Корреляционный анализ

Корреляционный анализ является одним из методов статистического анализа взаимозависимости нескольких признаков.

Основная задача корреляционного анализа состоит в оценке корреляционной матрицы генеральной совокупности по выборке и определении на основе этой матрицы частных и множественных коэффициентов корреляции и детерминации.

Парный и частный коэффициенты корреляции характеризуют тесноту линейной зависимости между двумя переменными соответственно на фоне действия и при исключении влияния всех остальных показателей, входящих в модель. Они изменяются в пределах от -1 до +1, причем чем ближе коэффициент корреляции к 1, тем сильнее зависимость между переменными. Если коэффициент корреляции больше нуля, то связь положительная, а если меньше нуля — отрицательная.

Множественный коэффициент корреляции характеризует тесноту, линейной связи между одной переменной (результативной) и остальными, входящими в модель; он изменяется в пределах от 0 до 1.

Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации. Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (аргументов), входящих в модель.

Исходной для анализа является матрица

размерности п х k , i-я строка которой характеризует i -е наблюдение (объект) по всем k показателям ( j = 1, 2, . k ).

В корреляционном анализе матрицу Х рассматривают как выборку объема п из k -мерной генеральной совокупности, подчиняющейся k-мерному нормальному закону распределения.

По выборке определяют оценки параметров генеральной совокупности, а именно: вектор средних , вектор средних квадратических отклонений s и корреляционную матрицу R порядка k:

xij значение i -го наблюдения j -го фактора,

ril выборочный парный коэффициент корреляции, характеризующий тесноту линейной связи между показателями xj и xl . При этом rjl является оценкой генерального парного коэффициента корреляции.

Матрица R является симметричной ( rjl = rlj ) и положительно определенной.

Кроме того, находятся точечные оценки частных и множественных коэффициентов корреляции любого порядка. Например, частный коэффициент корреляции (k — 2)-го порядка между переменными х1 и х2 равен

где Rjl алгебраическое дополнение элемента rjl корреляционной матрицы R. При этом Rjl = (- l ) j + l Mjl , где Mjl — минор, т.е. определитель матрицы, получаемой из матрицы R путем вычерчивания j —й строки и l -го столбца.

Множественный коэффициент корреляции ( k — 1)-го порядка результативного признака x 1 определяется по формуле

где | R | — определитель матрицы R.

Значимость частных и парных коэффициентов корреляции, т.е. гипотеза H 0: ρ = 0, проверяется по t -критерию Стьюдента. Наблюдаемое значение критерия находится по формуле

где r — соответственно оценка частного или парного коэффициента корреляции ρ; l — порядок частного коэффициента корреляции, т.е. число фиксируемых факторов (для парного коэффициента корреляции l=0).

Напомним, что проверяемый коэффициент корреляции считается значимым, т.е. гипотеза H 0: ρ = 0 отвергается с вероятностью ошибки α, если t набл по модулю будет больше, чем значение t кр, определяемое по таблицам t -распределения для заданного α и υ = nl — 2.

Значимость коэффициентов корреляции можно также проверить с помощью таблиц Фишера — Иейтса.

При определении с надежностью у доверительного интервала для значимого парного или частного коэффициента корреляции р используют Z-преобразование Фишера и предварительно устанавливают интервальную оценку для Z :

где tγ вычисляют по таблице значений интегральной функции Лапласа из условия

значение Z’ определяют по таблице Z-преобразования по найденному значению r . Функция Z’ — нечетная, т.е.

Обратный переход от Z к ρ осуществляют также по таблице Z-преобразования, после использования которой получают интервальную оценку для ρ с надежностью γ:

Таким образом, с вероятностью γ гарантируется, что генеральный коэффициент корреляции ρ будет находиться в интервале (rmin, r max ).

Значимость множественного коэффициента корреляции (или его квадрата — коэффициента детерминации) проверяется по F-критерию. Например, для множественного коэффициента корреляции проверка значимости сводится к проверке гипотезы, что генеральный множественный коэффициент корреляции равен нулю, т.е. H0 : ρ1/2,…, k = 0, а наблюдаемое значение статистики находится по формуле

Множественный коэффициент корреляции считается значимым, т.е. имеет место линейная статистическая зависимость между х1 и остальными факторами х2, . хk, если Fнабл > F кр, где F кр определяется по таблице F-распределения для заданных α , υ 1 = k — 1, υ 2 = n — k .

Смотрите также:

СТАТИСТИКА ЭКОНОМИЧЕСКАЯ. Отрасль статистики, изучающая материальное
производство с целью выявления пропорций, тенденций и закономерностей развития .
bibliotekar.ru/biznes-15-6/133.htm

ПРОГНОЗ ЭКОНОМИЧЕСКОЙ АКТИВНОСТИ . Вводный курс по
экономической теории . Главные направления современной экономической
bibliotekar.ru/biznes-64/164.htm

Л.П. Кроливецкой. — М.: Финансы и статистика, 1996. Березина М.П.
Безналичные расчеты в экономике России. — М.: Консалт-банкир, 1997.
bibliotekar.ru/biznes-36/index.htm

ОСНОВНЫЕ ВИДЫ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ . Статистика дает
общую картину состояния и развития национального хозяйства, освещает .
bibliotekar.ru/mezhdunarodnye-otnosheniya. /184.htm

Для студентов, обучающихся по специальностям «Статистика», «
Математические методы и исследование операций в экономике», «
bibliotekar.ru/riskovye-situacii-2/index.htm

межотраслевых (экономическая география, демография, статистика и др.).
Экономическая теория — одна из общественных наук наряду с историей, .
bibliotekar.ru/biznes-38/9.htm

Азимов Л.Б., Журавская Е.В., Макарова О.Ю. Преподавание экономики в
школе. . М.: Финансы и статистика, 1994. . Антология экономической
bibliotekar.ru/biznes-63/25.htm

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *