Статистическое изучение взаимосвязей социально-экономических явлений. Статистическое изучение взаимосвязи показателей Изучение взаимосвязей статистических показателей

13.1. Типы связей между явлениями, их характеристика

Изучение действительности показывает, что изменение изучаемого признака находитсяв тесной взаимосвязи с другими признаками.

При изучении конкретных зависимостей одни признаки выступают в качестве факторов , обуславливающих изменения других признаков – они называютсяфакторными признаками (Х).

Признаки, которые являются результатом влияния этих факторных признаков, называются результативными признаками (У).

Например: рассматривая зависимость между производительностью труда и квалификацией рабочих, уровень производительности труда является результативным признаком, а квалификация рабочих факторным, т.к. её повышение ведет к росту производительности труда.

Различают два основных вида связей между явлениями.

- функциональные связи характеризуются полнымсоответствием между изменением факторного и результативного признака (каждому значению признака – фактора соответствует вполне определенные значения результативного признака)

Примером функциональной связи является зависимость длины окружности (L) от радиуса (r).

- корреляционные связи, при которых между изменением факторного и результативного признаков нет полного соответствия, воздействия отдельных факторов проявляется лишь в среднем при массовомнаблюдении, фактических данных.

В простейшем случае применения корреляционной зависимости величина результативного признака рассматривается как следствие изменения только одного фактора (например: рост квалификации рабочих рассматривается как причина роста производительности труда).

Однако выделенный в данном примере в качестве основного признак – фактор не является единственной причиной изменения результативного признака, а на ряду с ним на величину результативного признака влияет множество других причин (в частности на производительность труда влияет уровень энерговооруженности, механизации и автоматизации производства).

При наличии корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака.

Объяснения этому – сложность взаимосвязей между анализируемыми факторами, взаимодействие которых влияют неучтенные, случайные величины. Поэтому связь появляется лишь в среднем, в массе случаев.

При корреляционной связи каждому значению аргумента (х -признака фактора).

Соответствует случайно распределенные в некотором интервале значения функции (у – признака результата).

Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесенных удобрений. Очевидно, что удобрения участвуют в формировании урожая, для конкретного поля участии одного и того же количества удобрений вызовет разный прирост урожайности, так как во взаимодействии находится ещё целый ряд факторов (погода, состояние почвы и т. д.), которые формируют урожай. Однако в среднем такая связь наблюдается увеличение массы внесенных, удобрений ведет к росту урожайности.

Виды взаимосвязей:

a) По направлению связи делятся на:
- прямые – когда зависимая переменная растёт с увеличением факторного признака (положительная связь)
- обратные, когда рост факторного признака ведёт к уменьшению результативного (отрицательная связь)

б) По степени тесноты:

в) По аналитическому выражению:
- линейные
- криволинейные.

Задачи статистики в изучении связей между явлениями заключается в следующем:

1. количественная оценка наличия и направления связи;

2. характеристика формы влияния одних факторов на другие (изменение степени тесноты корреляционной связи);

3. нахождение аналитического выражения связи (построение уравнений регрессии или корреляционно-регрессионных моделей);

4. оценка соответствия полученных моделей и их практическое использование.

13.2. Методы выявления наличия корреляционной связи между двумя признаками

Для ответа на вопрос о наличии или отсутствии корреляционной связи используется ряд методов:

- параллельное сопоставление рядов значений результативного и факторного признаков , является простейшим приёмом. Значения факторного признака располагаются в возрастающем порядке, а затем прослеживают направление изменения величины результативного признака;

Однако наличие большого числа различных значений результативного признака, соответствующих одному и тому же значению признака-фактора, затрудняет восприятие таких параллельных рядов. В таких случаях для установления связи – пользуются статистическими таблицами – корреляционными и групповыми .

Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков.

При этом факторный признак (х), как правило, имеет конкретные значения и располагается в строках; а результативный признак (y) представлен в виде интервалов и располагается в столбцах таблицы.

Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту построения данного сочетания значений Х и Y.

Такая корреляционная таблица уже при общем знакомстве даёт возможность:

Определить наличие или отсутствие связи;

Выяснить её направление.

Если частоты в корреляционной таблице расположены по диагонали из левого верхнего угла в правый нижний (т.е. большим значениям фактора соответствуют большие значения результата), то можно предположить наличие прямой корреляционной зависимости между признаками.

Если же частоты располагаются с правого верхнего угла к левому нижнему, то предполагают наличие обратной связи.

Построение групповой таблицы также начинают с группировки. По каждой группе вычисляют средние значения результативного признака, и дальше происходит сопоставление полученных данных.

- Графический метод применяется для:

· Предварительного выявления наличия или отсутствия связи;

· Определения характера и формы связи.

Используя данные об индивидуальных значениях признака-фактора и соответствующих значениях результативного признака, можно построить в прямоугольных осях точечный график, который называется поле корреляции.

Определив среднее значение точек, можно построить линию, которая является эмпирической линией связи.

Если эмпирическая линия связи приближается к прямой линии связи, то возможно наличие прямолинейной линии корреляционной связи между признаками.

Если к какой-либо кривой, то возможна криволинейная корреляционная связь.

13.3. Измерение степени тесноты корреляционной связи между двумя признаками

Понятно, что одни факторы влияют сильнее, другие слабее на результативный признак.

Характеристика силы воздействия одних факторов на другие даётся при помощи показателей степени тесноты корреляционной связи между двумя признаками, к ним относятся:

· Коэффициент корреляции знаков;

· Линейный коэффициент корреляции;

· Коэффициент корреляции рангов

а) Коэффициент корреляции знаков

Число совпадений знаков отклонения индивидуальных величин от средней факторного и результативного признаков;

Число несовпадений знаков отклонений.

б) Линейный коэффициент корреляции является более совершенным показателем степени тесноты связи. При расчёте этого показателя учитываются не только знаки отклонений, но и сами величины таких отклонений.

Есть много вариантов этой формулы.

Много учёных занималось вопросами корреляции и в целом стохастических зависимостей (проявляется в массе случаев).

Множественная корреляция.

Коэффициент множественной корреляции: , где

Общая дисперсия фактических данных результативного признака, т.е. дисперсия y .

Остаточная дисперсия, характеризующая вариацию y за счёт факторов не включённых в уравнение регрессии.

Отражает тесноту связи между вариацией зависимой переменной и вариациями всех включённых в анализ независимых переменных

0< <1 чем ближе к 1, тем более сильная связь, к 0 - не все факторы учтены, не подходящая форма уравнения.

в) Коэффициент корреляции рангов (коэффициент связи качественных признаков)

Позволяет измерить тесноту связи между качественными признаками, которые не поддаются выражению числом. Каждой единице совокупности присваивается порядковый номер в ряду, который будет упорядочен по уровню признака. Таким образом, ряд значений ранжируется, а номер каждой отдельной единицы будет её рангом.

Можно получить представление, о корреляционной связи сопоставляя ранги факторного и результативного признаков. Метод Спирмена и метод Кенделла.

13.4. Уравнения регрессии, их виды

Изучение корреляционных зависимостей основывается на исследовании таких связей между переменными, при которых значение одной переменной, которую можно применять за зависимую переменную «в среднем» изменяется в зависимости от того, какие значения принимает другая переменная, рассматриваемая, как причина по отношению к зависимой переменной.

Изучение зависимостей ведёт к поиску аналитических связей в виде формул (т.е. функций, который записываются составлением уравнений регрессии ).

А на графическом поле строится теоретическая линия регрессии– это та линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление, основную тенденцию связи.

Наиболее часто для характеристики связей экономических явлений используются такие типы функций:

Линейную:

Гиперболическую:

Показательную:

Степенную:

13.5. Корреляционно-регрессивные модели (КРМ),

их применение в анализе и прогнозе

На практике чаще всего изменение изучаемого признака зависит от действия нескольких причин. В таких случаях изменение корреляционной связи не может ограничиться парными зависимостями, и в анализ необходимо включить другие признаки-факторы существенно влияющие на изучаемую переменную.

Отбор факторов для построения многофакторных моделей производится на основе качественного и количественного анализа социально-экономических явлений с использованием статистических критериев.

Корреляционно-регрессивной моделью системы взаимосвязанных признаков является такое уравнение регрессии, которое включает основные факторы.

Построение многофакторных регрессионных моделей позволяет дать количественное описание основных закономерностей изучаемых явлений, выделить существенные факторы, обуславливающие изменение экономических показателей, и оценить их влияние.

Полученные модели в основном используются в двух направлениях:

· Для сравнительного анализа

· В прогнозировании

Возможность применения методов корреляционно-регрессивного анализа ещё в недалёком прошлом сдерживалась высокой трудоёмкостью необходимых расчётов. Сегодня широкое распространение получили пакеты прикладных программ по статистике, ликвидировав эти ограничения.

С целью расширения возможностей экономического анализа используют коэффициент эластичности:

, где

Среднее значение факторного признака

Среднее значение результативного признака

Коэффициент регрессии при соответствующем факторном признаке.

Показывает на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака.

Устанавливают как справочную величину.

Следует различать функциональные и корреляционные связи. В отличие от функциональной зависимости, при которой каждому значению одной переменной строго соответствует одно определённое значение другой переменной, зависимость, при которой одному значению переменной (х ) может соответствовать (в силу наслоения действия других причин) множество значений другой переменной (y ), называют корреляционной. Корреляционная зависимость проявляется лишь на основе массового наблюдения.

Примером корреляционной зависимости может служить зависимость производительности труда от стажа работы рабочих, зависимость урожайности от срока сева, зависимость годового удоя коров от количества отёлов и т.п.

Наиболее простым случаем корреляционной зависимости является парная корреляция, т.е. зависимость между двумя признаками (результативными и одним из факторных).

Основными задачами при изучении корреляционных зависимостей являются:

1. отыскание математической формулы, которая бы выражала эту зависимость y от x

2. измерение тесноты такой зависимости.

Решение первой задачи, т.е. определение формы связи с последующим отысканием параметров уравнения, называется нахождением уравнения связи (уравнения регрессии). Показатели, рассматриваемые как функция х , обозначают (читается: «игрек, выровненный по икс»).

Возможны различные формы связи:

1. прямолинейная:

2. криволинейная в виде:
а) параболы второго порядка (или высших порядков)
б) гиперболы
в) показательной функции и т.д.

Параметры для всех уравнений связи чаще всего определяют из так называемой системы нормальных уравнений , отвечающих требованию «метода наименьших квадратов» (МНК). Это требование можно записать как или, при линейной зависимости, т.е. требуется определить, при каких значениях параметров и сумма квадратов отклонений y от будет минимальной. Найдя частные производные указанной суммы по и и приравняв их к нулю, легко записать систему уравнений, решение которой и дают параметры искомой функции, т.е. уравнения регрессии.

Так, система нормальных уравнений при линейной зависимости имеет вид:

Если связь выражена параболой второго порядка

то система нормальных уравнений для отыскания параметров , , выглядит следующим образом:

Вторая задача – измерение тесноты зависимости – для всех форм связи может быть решена с помощью исчисления теоретического корреляционного отношения :

Дисперсия в ряду выравненных значений
результативного показателя ;

Дисперсия в ряду фактических значений y.

Так как дисперсия отражает вариацию в ряду только за счёт вариации фактора x , а дисперсия отражает вариацию y за счёт всех факторов, то их отношение, именуемое теоретическим коэффициентом детерминации , показывает, какой удельный вес в общей дисперсии ряда y занимает дисперсия, вызываемая вариацией фактора х . квадратный корень из отношения этих дисперсий даёт нам теоретическое корреляционное отношение. Если = , то это означает, что роль других факторов в вариации y сведена на нет, и отношение:

Означает полную зависимость вариации y от х .

Если =0, то это означает, что вариация х никак не влияет на вариацию y , и в этом случае .

Следовательно, максимальное значение, которое может принимать корреляционное отношение, равно 1, минимальное значение – 0.

Математически легко доказывается, что в случае линейной зависимости корреляционное отношение может быть заменено выражением которое называют линейным коэффициентом корреляциии обозначают r , т.е. где - коэффициент регрессии в уравнении связи, и - соответственно среднее квадратическое отклонение в ряду x и в ряду y.

Линейный коэффициент корреляции можно выразить и другими формулами, тождественными первой, в частности:

или а также

Линейный коэффициент корреляции может принимать по модулю значения от 0 до 1 (знак «+» при прямой зависимости и знак «-» при обратной зависимости).

Рассмотрим решение задачи по этой теме.

Задача 1

Пусть по 10 однотипным предприятиям имеются следующие данные о выпуске продукции (х ) в тыс. ед. и о расходе условного топлива (y ) в тоннах (графы 1 и 2 таблицы).

Требуется найти уравнение зависимости расхода топлива от выпуска продукции (или уравнение регрессии y по x ) и измерить тесноту зависимости между ними.

Решение.

А.рассматривая уравнение регрессии в форме линейной функции вида , параметры данного уравнения ( и ) найдём из системы нормальных уравнений

X	y	x 2	xy	=1,16+0,547x	y 2

				3,9 4,4 5,5 5,5 6,6 6,6 8,8 12,1 12,1 14,3

Необходимые для решения суммы , , рассчитаны выше в таблице. Подставляем их в уравнения и решаем систему:

Отсюда , предварительно найдя то линейный коэффициент корреляции r=0,96 считается значимым, а связь между x и y – реальной.

Контрольные вопросы к теме :

1. Какие признаки являются результативными, факторными.

2. Какие два основных вида связей между явлениями различают. Объясните их суть.

3. Расскажите классификацию взаимосвязей.

4. В чем заключаются задачи статистики при изучении связей между явлениями.

5. Расскажите, какие вы знаете методы выявления наличия корреляционной связи между двумя признаками.

6. При помощи, каких показателей дается характеристика силы воздействия одних факторов на другие.

7. Расскажите о коэффициенте множественной корреляции.

8. Что такое «корреляционно-регрессивные модели» и каково их применение в анализе и прогнозе.

9. Расскажите о линейном коэффициенте корреляции.

10. В чем суть метода наименьших квадратов.

Библиографический список

1. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. 5-е изд., перераб. и доп. М.: Финансы и статистика, 2004.

2. Ефимова М.Р., Петрова Е.В., Румянцева В.Н. Общая теория статистики: Учебник. – 2-е изд., испр. и доп. – М.: ИНФРА-М, 2000. – 416 с.

3. Общая теория статистики: Учебник / Под ред. О.Э. Башиной, А.А. Спирина, 5-е изд. М., 1999.

4. Практикум по теории статистики: Учеб. пособие / Под ред. Р.А. Шмойловой. М.: Финансы и статистика, 1999.

5. Сиденко А.В., Попов Г.Ю., Матвеева В.М. Статистика: Учебник. М., 2000.

6. Социальная статистика: Учебник / Под ред. И.И. Елисеевой. 3-е изд., перераб. и доп. М.: Финансы и статистика, 2003.

7. Статистика товаров и услуг: Учебник / Под ред. И.К. Белявского. М., 2002.

8. Статистика: Учебник / Под ред. В.С. Мхитаряна. М.: Экономист, 2005

9. Теория статистики: Учебник/Под ред. профессора Г.Л. Громыко. – М.: ИНФРА-М, 2000. – 414 с.

10. Экономика и статистика фирм / Под ред. С.Д. Ильенковой. М., 2000

Аннотация: Для большинства статистических исследований важно выявить существующие взаимосвязи между протекающими явлениями и процессами. Почти все наблюдаемые явления экономической жизни общества, какими бы независимыми они ни казались на первый взгляд, как правило, - следствие действия определенных факторов. Например, прибыль, получаемая предприятием, связана со множеством показателей: численностью работников, их образованием, стоимостью основных производственных фондов и т. п.

12.1. Понятие о функциональной и корреляционной связи

Между общественными и экономическими явлениями имеется два основных типа связи - функциональная и статистическая (называемая также стохастической, вероятностной или корреляционной). Перед тем как рассмотреть их подробнее, введем понятия независимых и зависимых признаков.

Независимыми, или факторными, называют признаки, которые вызывают изменения других, связанных с ними признаков. Признаки, изменение которых под воздействием определенных факторов требуется проследить, называют зависимыми, или результативными.

При функциональной связи изменение независимых переменных приводит к получению точно определенных значений зависимой переменной.

Наиболее часто функциональные связи проявляются в естественных науках, например в механике функциональной является зависимость расстояния, пройденного объектом, от скорости его движения и т. п.

При статистической связи каждому значению независимой переменной Х соответствует множество значений зависимой переменной Y, причем не известно заранее, какое именно. Например, мы знаем, что прибыль коммерческого банка определенным образом связана с размером его уставного капитала (этот факт не подлежит сомнению). Тем не менее, нельзя вычислить точную величину прибыли при заданном значении последнего показателя, так как она зависит еще и от множества других факторов, помимо размера уставного капитала, среди которых имеются и случайные. В нашем случае, скорее всего, мы определим лишь среднее значение прибыли, которое будет получено в целом по совокупности банков со сходным объемом уставного капитала. Таким образом, статистическая связь отличается от функциональной наличием действия на зависимую переменную большого числа факторов.

Заметим, что статистическая связь проявляется лишь "в общем и среднем" при большом числе наблюдений за явлением. Так, интуитивно мы можем предполагать, что существует зависимость между объемом основных фондов предприятия и получаемой им прибылью, а именно с увеличением первого размер прибыли возрастает. Но на это можно возразить и привести пример предприятия, обладающего достаточным количеством современного производственного оборудования, но тем не менее терпящего убытки. В данном случае мы имеем наглядный пример статистической связи, которая проявляется лишь в больших совокупностях, содержащих десятки и сотни единиц в отличие от функциональной, подтверждающейся для каждого наблюдения.

Корреляционной является статистическая связь между признаками, при которой изменение значений независимой переменной Х приводит к закономерному изменению математического ожидания случайной величины Y.

Пример 12.1. Предположим, что имеются данные по предприятиям о размере нераспределенной прибыли предыдущего года, объеме инвестиций в основной капитал и о суммах, выделенных на приобретение ценных бумаг (тыс. ден. ед.):

Таблица 12.1.

Номер предприятия	Нераспределенная прибыль предыдущего года	Приобретение ценных бумаг	Инвестиции в основные фонды
1	3 010	190	100
2	3 100	182	250
3	3 452	185	280
4	3 740	170	270
5	3 980	172	330
6	4 200	160	420
7	4 500	145	606
8	5 020	120	690
9	5 112	90	800
10	5 300	30	950

Из таблицы видно, что имеется прямое соответствие между нераспределенной прибылью предприятия и его инвестициями в основной капитал : при увеличении нераспределенной прибыли объем инвестиций также возрастает. Теперь обратим внимание на связь между показателем нераспределенной прибыли и объемом приобретенных ценных бумаг. Здесь она носит совершенно иной характер: увеличение первого показателя приводит к прямо противоположному эффекту - стоимость приобретенных ценных бумаг за редким исключением (что уже однозначно исключает наличие функциональной связи) уменьшается. Такой визуальный анализ данных , при котором наблюдения ранжируются по возрастанию или убыванию независимой величины х, а затем анализируется изменение значений зависимой величины у, называется методом приведения параллельных данных.

В рассмотренном примере в первом случае связь прямая, т.д. увеличение (уменьшение) одного показателя влечет увеличение (уменьшение) другого (наблюдается соответствие в изменениях показателей), а во втором - обратная, т.д. уменьшение одного показателя вызывает рост другого или же увеличение одного соответствует снижению другого.

Прямая и обратная зависимости характеризуют направление связи между признаками, которую можно проиллюстрировать графически с помощью поля корреляции. При его построении в прямоугольной системе координат на оси абсцисс располагают значения независимой переменной х, а на оси ординат - зависимой у. Пересечение координат обозначают точками, которые символизируют наблюдения. По форме рассеяния точек на корреляционном поле судят о форме и тесноте связи. На рисунке 12.1 приводятся корреляционные поля, соответствующие различным формам связи.

Рис. 12.1.

а - прямая (положительная) связь ;

б - обратная (отрицательная) связь ;

в - отсутствие связи

Раздел статистической науки, занимающийся исследованием причинных связей между социально-экономическими явлениями и процессами, имеющими количественное выражение , - это корреляционно-регрессионный анализ . По существу имеются два отдельных направления анализа - корреляционный и регрессионный. Однако в связи с тем, что на практике они применяются чаще всего комплексно (исходя из результатов корреляционного анализа проводят регрессионный), их объединяют в один вид.

Проведение корреляционно-регрессионного анализа предполагает решение следующих задач:

Из перечисленных задач первые две относят непосредственно к задачам корреляционного анализа, три последующие - к регрессионному анализу и только по отношению к количественным показателям.

12.1.1. Требования к статистической информации, исследуемой методами корреляционно-регрессионного анализа

Методы корреляционно-регрессионного анализа можно применить не ко всем статистическим данным. Перечислим основные требования, предъявляемые к анализируемой информации:

используемые для исследования наблюдения должны являться случайно выбранными из генеральной совокупности объектов. В противном случае исходные данные, представляющие собой определенную выборку из генеральной совокупности, не будут отражать ее характер, полученные по ним выводы о закономерностях развития окажутся бессмысленными и не имеющими никакой практической ценности;
требование независимости наблюдений друг от друга. Зависимость наблюдений друг от друга называется автокорреляцией, для ее устранения в теории корреляционно-регрессионного анализа созданы специальные методы;
исходная совокупность данных должна быть однородной, без аномальных наблюдений. И действительно, одно-единственное, резко выделяющееся наблюдение может привести к катастрофическим последствиям для регрессионной модели, ее параметры окажутся смещенными, выводы абсурдными;
желательно, чтобы исходные данные для анализа подчинялись нормальному закону распределения. Нормальный закон распределения используется для того, чтобы при проверке значимости коэффициентов корреляции и построении для них интервальных границ можно было использовать определенные критерии. Если же проверять значимость и строить интервальные оценки не требуется, переменные могут иметь любой закон распределения. В регрессионном анализе при построении уравнения регрессии требование нормальности распределения исходных данных предъявляется лишь к результативной переменной Y, независимые факторы рассматриваются как неслучайные величины и могут в действительности иметь любой закон распределения. Как и в случае корреляционного анализа, требование нормальности распределения нужно для проверки значимости регрессионного уравнения, его коэффициентов и нахождения доверительных интервалов;
число наблюдений, по которым устанавливается взаимосвязь признаков и строится модель регрессии, должно превышать количество факторных признаков хотя бы в 3-4 раза (а лучше в 8-10 раз). Как отмечалось выше, статистическая связь проявляется только при значительном числе наблюдений на основе действия закона больших чисел, причем, чем связь слабее, тем больше требуется наблюдений для установления связи, чем сильнее - тем меньше;
факторные признаки Х не должны находиться между собой в функциональной зависимости. Значительная связь независимых (факторных, объясняющих) признаков между собой указывает на мультиколлениарность. Ее наличие приводит к построению неустойчивых регрессионных моделей, "ложных" регрессий.

12.1.2. Линейная и нелинейная связи

Линейная связь выражается прямой линией, а нелинейная - какой-либо кривой линией. Линейная связь выражается уравнением прямой: y = a 0 + a i *x. Прямая наиболее привлекательна с точки зрения простоты расчета параметров уравнения. К ней прибегают всегда, в том числе и в случаях нелинейных связей, когда нет угрозы значительных потерь в точности оценок. Однако для некоторых зависимостей представление их в линейной форме приводит к большим ошибкам (ошибкам аппроксимации) и, как следствие, к ложным выводам. В этих случаях используют нелинейные регрессионные функции, которые в общем случае могут иметь любой произвольный вид, тем более что современное программное обеспечение позволяет быстро их построить. Чаще всего для выражения нелинейной связи используются следующие нелинейные уравнения: степенное, параболическое, гиперболическое, логарифмическое.

Параметры этих моделей, как и в случаях линейных зависимостей, оцениваются также на основе метода наименьших квадратов (см. п. 12.3.1).

12.2. Корреляционно-регрессионный анализ

Основными задачами корреляционного анализа являются определение наличия связи между отобранными признаками, установление ее направления и количественная оценка тесноты связи. Для этого в корреляционном анализе сначала оценивается матрица парных коэффициентов корреляции, затем на ее основе определяются частные и множественные коэффициенты корреляции и детерминации. После нахождения значений коэффициентов проверяют их значимость . Конечный результат корреляционного анализа - это отбор факторных признаков Х для дальнейшего построения уравнения регрессии, позволяющего количественно описать взаимосвязь.

Рассмотрим этапы корреляционного анализа подробнее.

12.2.1. Парные (линейные) коэффициенты корреляции

Корреляционный анализ начинается с расчета парных (линейных) коэффициентов корреляции.

Парный коэффициент корреляции представляет собой меру линейной зависимости между двумя переменными на фоне действия остальных переменных, входящих в модель.

В зависимости от того, какой порядок вычислений более удобен исследователю, расчет данного коэффициента проводят по одной из следующих формул:

Парный коэффициент корреляции изменяется в пределах от -1 до +1. Абсолютное значение, равное единице, свидетельствует о том, что связь функциональная: -1 - обратная (отрицательная), +1 - прямая (положительная). Нулевое значение коэффициента указывает на отсутствие линейной связи между признаками.

Качественную оценку полученным количественным значениям парных коэффициентов корреляции можно дать на основе шкалы, представленной в табл. 12.2.

Примечание: положительное значение коэффициента говорит о том, что связь между признаками прямая, отрицательное - обратная.

12.2.2. Оценка существенности связи

После того, как значения коэффициентов получены, следует проверить их значимость. Поскольку исходные данные, по которым устанавливается взаимосвязь признаков, являются определенной выборкой из некоей генеральной совокупности объектов, исчисленные по этим данным парные коэффициенты корреляции будут выборочными. Таким образом, они лишь оценивают связь исходя из той информации, которую несут отобранные единицы наблюдения. Если исходные данные "хорошо" отражают структуру и закономерности генеральной совокупности, то и исчисленный по ним коэффициент корреляции будет показывать реальную связь, присущую в действительности всей исследуемой совокупности объектов. Если данные не "копируют" взаимосвязи совокупности в целом, то и рассчитанный коэффициент корреляции сформирует ложное представление о зависимости. В идеале, чтобы установить этот факт, требуется исчислить коэффициент корреляции на основе данных всей совокупности и сравнить его с исчисленным по отобранным наблюдениям. Однако на практике, как правило, этого сделать нельзя, так как зачастую неизвестна вся генеральная совокупность или же она слишком велика. Поэтому о том, насколько реально коэффициент представляет действительность, можно судить лишь приблизительно. На основе логики легко прийти к выводу, что, очевидно, с увеличением числа наблюдений (при ) доверие к исчисленному коэффициенту будет увеличиваться.

Значимость парных коэффициентов корреляции проверяется одним из двух способов: с помощью таблицы Фишера - Йейтса или по t-критерию Стьюдента. Рассмотрим способ проверки с помощью таблицы Фишера - Йейтса как наиболее простой.

В начале проверки задается уровень значимости (чаще всего обозначаемый буквой греческого алфавита "альфа" - ), который показывает вероятность принятия ошибочного решения. Возможность совершить ошибку вытекает из того факта, что для определения взаимосвязи используются данные не всей совокупности, а лишь ее части. Обычно принимает следующие значения: 0,05; 0,02; 0,01; 0,001. Например, если = 0,05, то это означает, что в среднем в пяти случаях из ста принятое решение о значимости (или незначимости) парных коэффициентов корреляции будет ошибочным; при = 0,001 - в одном случае из тысячи и т.д.

Вторым параметром при проверке значимости является число степеней свободы v, которое в данном случае вычисляется как v = n - 2. По таблице Фишера - Йейтса находится критическое значение коэффициента корреляции r кр. ( = 0,05, v = n - 2). Коэффициенты, значения которых по модулю больше найденного критического значения, считаются значимыми.

Пример 12.2. Предположим, что в первом случае имеется 12 наблюдений, и по ним вычислили парный коэффициент корреляции, который оказался равным 0,530, во втором - 92 наблюдения, и рассчитанный парный коэффициент корреляции составил 0,36. Но если мы проверим их значимость, в первом случае коэффициент окажется незначимым, а во втором - значимым, невзирая на то, что он по величине гораздо меньше. Оказывается, в первом случае слишком мало наблюдений, что повышает требования, и критическая величина парного коэффициента корреляции при уровне значимости = 0,05 составляет 0,576 (v = 12 - 2), а во втором - наблюдений значительно больше и достаточно превысить критическое значение 0,205 (v = 92 - 2), чтобы коэффициент корреляции при том же уровне оказался значимым. Таким образом, чем меньше наблюдений, тем всегда будет выше критическое значение коэффициента.

Проверка значимости по существу решает вопрос, случайны или нет полученные результаты расчетов.

12.2.3. Определение множественного коэффициента корреляции

Следующий этап корреляционного анализа связан с расчетом множественного (совокупного) коэффициента корреляции.

Множественный коэффициент корреляции характеризует тесноту линейной связи между одной переменной и совокупностью других переменных, рассматриваемых в корреляционном анализе.

Если изучается связь между результативным признаком y и лишь двумя факторными признаками х 1 и х 2 , то для вычисления множественного коэффициента корреляции можно использовать следующую формулу, компонентами которой являются парные коэффициенты корреляции:

где r - парные коэффициенты корреляции.

Исследование объективно существующих связей между явлениями - важнейшая задача общей теории статистики. В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения - это связь явлений и процессов, при которой изменение одного из них - причины - ведет к изменению другого - следствия.

Причина - это совокупность условий, обстоятельств, действие которых приводит к появлению следствия. Если между явлениями действительно существуют причинно-следственные отношения, то эти условия должны обязательно реализовываться вместе с действием причин. Причинные связи носят всеобщий и многообразный характер, и для обнаружения причинно-следственных связей необходимо отбирать отдельные явления и изучать их изолированно.

Особое значение при исследовании причинно-следственных связей имеет выявление временной последовательности: причина всегда должна предшествовать следствию, однако не каждое предшествующее событие следует считать причиной, а последующее - следствием.

В реальной социально-экономической действительности причину и следствие необходимо рассматривать как смежные явления, появление которых обусловлено комплексом сопутствующих более простых причин и следствий. Между сложными группами причин и следствий возможны многозначные связи, в которых за одной причиной будет следовать то одно, то другое действие или одно действие будет иметь несколько различных причин. Чтобы установить однозначную причинную связь между явлениями или предсказать возможные следствия конкретной причины, необходима полная абстракция от всех прочих явлений в исследуемой временной или пространственной среде. Теоретически такая абстракция воспроизводится. Приемы абстракции часто применяются при изучении взаимосвязей между двумя признаками (парная корреляция). Но чем сложнее изучаемые явления, тем труднее выявить причинно-следственные связи между ними. Взаимное переплетение различных внутренних и внешних факторов неизбежно приводит к некоторым ошибкам в определении причины и следствия.

Особенностью причинно-следственных связей в социально-экономических явлениях является их транзитивность, т.е. причина и следствие связаны соотношением, а не непосредственно. Однако промежуточные факторы, как правило, при анализе опускаются.

Так, например, при использовании показателей международной методологии расчетов фактором валовой прибыли считается валовое накопление основных и оборотных фондов, но при этом допускаются такие факторы, как валовой выпуск, оплата труда и т.д. Правильно вскрытые причинно-следственные связи позволяют установить силу воздействия отдельных факторов на результаты хозяйственной деятельности.

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо, абстрагируясь от второстепенных, выявлять главные, основные причины.

На первом этапе статистического изучения связи осуществляется качественный анализ изучаемого явления методами экономической теории, социологии, конкретной экономики.

На втором этапе строится модель связи на основе методов статистики: группировок, средних величин, таблиц и т. д.

На третьем, последнем этапе интерпретируются результаты; анализ вновь связан с качественными особенностями изучаемого явления.

Статистика разработала множество методов изучения связей, выбор которых зависит от целей исследования и поставленных задач. Связи между признаками и явлениями, ввиду их большого разнообразия, классифицируются по ряду оснований. Признаки по значению для изучения взаимосвязи делятся на два класса. Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, являются результативными. Связи между явлениями и их признаками классифицируются по степени тесноты связи, направлению и аналитическому выражению.

В статистике различают функциональную связь и стохастическую зависимость. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Функциональная связь проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности.

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

По степени тесноты связи различают количественные критерии оценки тесноты связи (табл. 1).

Таблица 1 Количественные критерии оценки тесноты связи

По направлению выделяют связь прямую и обратную. При прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. Так, например, рост производительности труда способствует увеличению уровня рентабельности производства. В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака. Так, с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.

По аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные. Если статистическая связь между явлениями может быть приближенно выражена уравнением прямой линии, то ее называют линейной связью; если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы, степенной, показательной, экспоненциальной и т. д.), то такую связь называют нелинейной или криволинейной.

В статистике не всегда требуются количественные оценки связи, часто важно определить лишь ее направление и характер, выявить форму воздействия одних факторов на другие. Для выявления наличия связи, ее характера и направления в статистике используются методы приведения параллельных данных; аналитических группировок; графический; корреляционный, регрессионный.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере. Сравним изменения двух величин и с увеличением величины величина также возрастает. Поэтому связь между ними прямая, и описать ее можно или уравнением прямой, или уравнением параболы второго порядка.

Взаимосвязь двух признаков изображается графически с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Каждое пересечение линий, проводимых через эти оси, обозначается точкой. При отсутствии тесных связей наблюдается беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

Для социально-экономических явлений характерно, что наряду с существенными факторами, формирующими уровень результативного признака, на него оказывают воздействие многие другие неучтенные и случайные факторы. Это свидетельствует о том, что взаимосвязи явлений, которые изучает статистика, носят корреляционный характер и аналитически выражаются функцией вида.

Корреляционный метод имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Корреляция - это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

В статистике различаются следующие варианты зависимостей:

-парная корреляция - связь между двумя признаками (результативным и факторным или двумя факторными);
-частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков;
-множественная корреляция - зависимость результативного и двух или более факторных признаков, включенных в исследование.

Теснота связи количественно выражается величиной коэффициентов корреляции. Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками, дают возможность определить «полезность» факторных признаков при построении уравнений множественной регрессии. Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

Первоначально исследования корреляции проводились в биологии, а позднее распространились и на другие области, в том числе на социально-экономическую. Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: корреляция оценивает силу (тесноту) статистической связи, регрессия исследует ее форму. Та и другая служат для установления соотношения между явлениями, для определения наличия или отсутствия связи.

Корреляционный и регрессионный анализ как общее понятие включает в себя измерение тесноты, направления связи и установление аналитического выражения (формы) связи (регрессионный анализ).

Регрессионный метод заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Регрессия может быть однофакторной (парной) и многофакторной (множественной).

По форме зависимости различают:

Линейную регрессию, которая выражается уравнением прямой (линейной функцией) вида:

Yx = а0 + а1х;

Нелинейную регрессию, которая выражается уравнениями вида:

Yx = а0 + а1х + а2 х 2 - парабола; Yx = а0 ++ а1/х - гипербола

По направлению связи различают:

-прямую регрессию (положительную), возникающую при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются;
-обратную (отрицательную) регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.

Положительную и отрицательную регрессии можно легче понять, если использовать их графическое изображение.

Для простой (парной) регрессии в условиях, когда достаточно полно установлены причинно-следственные связи, приобретает практический смысл только последнее положение; при множественности причинных связей невозможно четко отграничить одни причинные явления от других.

сезонный колебание регрессия

9.1. Причинность, регрессия, корреляция

В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие основное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения – это связь явлений и процессов, когда изменение одного из них – причины, ведет к изменению другого – следствия.

Признаки по их значению для изучения взаимосвязи делятся на два вида: факторные и результативные.

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных.

В основе первого этапа статистического изучения связи лежит качественный анализ изучаемого явления, т.е. исследование его природы методами экономической теории, социологии, конкретной экономики. Второй этап – построение модели связи. Третий, последний этап – интерпретация результатов, вновь связан с качественными особенностями изучаемого явления.

В статистике различают функциональную связь и стохастическую. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Такая связь проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности. Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

Связи между признаками и явлениями ввиду их большого разнообразия классифицируются по ряду оснований: по степени тесноты связи, направлению и аналитическому выражению.

Степень тесноты корреляционной связи количественно может быть оценена с помощью коэффициента корреляции, величина которого определяет характер связи (табл. 1).

Таблица 1 - Количественные критерии тесноты связи

По направлению выделяют связь прямую и обратную .

При прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. В случае обратной связи с увеличением значений факторного признака значения результативного убывают, и наоборот.

По аналитическому выражению выделяют связи: прямолинейные (или просто линейные) и нелинейные . Если статистическая связь между явлениями может быть приближенно выражена уравнением прямой линии, то ее называют линейной; если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы, показательной, экспоненциальной и т.п.), то такую связь называют нелинейной или криволинейной.

Для выявления наличия связи, ее характера и направления в статистике используются методы: приведения параллельных данных; аналитических группировок; статистических графиков; корреляции.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере. Например, изменение двух величин представлено следующими данными.

Графически взаимосвязь двух признаков изображается с помощью поля корреляции . В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи (рис.).

При отсутствии тесных связей имеет место беспорядочное расположение точек на графике.

Для социально-экономических явлений характерно, что наряду с существенными факторами, формирующими уровень результативного признака на него оказывают влияние многие другие неучтенные и случайные факторы. Это свидетельствует о том, что взаимосвязи явлений, которые изучает статистика, носят корреляционный характер.

Корреляция – это статистическая взаимосвязь между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания (средней величины) другой.

В статистике принято различать следующие виды зависимостей .

1. Парная корреляция – связь между двумя признаками (результативным и факторным или двумя факторными).

2. Частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

3. Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование.

Задачей корреляционного анализа является количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаком (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции, которые дают возможность определить «полезность» факторных признаков при построении уравнений множественной регрессии. Кроме того, величина коэффициента корреляции служит оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

9.2. Оценка тесноты связи

Теснота корреляционной связи между факторным и результативным признаками может исчисляться с помощью таких коэффициентов : эмпирический коэффициент корреляционной связи (коэффициент Фехнера); коэффициент ассоциации; коэффициент взаимной сопряженности Пирсона и Чупрова; коэффициент контингенции; ранговые коэффициенты корреляции Спирмэна и Кендэла; линейный коэффициент корреляции; корреляционное отношение и др.

Наиболее совершенно тесноту связи характеризует линейный коэффициент корреляции: , где – средняя из произведений значений признаков ху ; – средние значения признаков х и у ; - средние квадратические отклонения признаков х и у. Он используется в том случае, если связь между признаками линейная

Линейный коэффициент корреляции может быть положительным или отрицательным.

Положительная его величина свидетельствует о прямой связи, отрицательная – об обратной. Чем ближе к ±1, тем связь теснее. При функциональной связи между признаками = ±1. Близость к 0 означает, что связь между признаками слабая.

9.3. Методы регрессионного анализа

С понятием корреляции тесно связано понятие регрессии . Первая служит для оценки тесноты связи, вторая - исследует ее форму. Корреляционно-регрессионный анализ , как общее понятие, включает в себя измерение тесноты и направления связи (корреляционный анализ) и установление аналитического выражения (формы) связи (регрессионный анализ).

После того, как с помощью корреляционного анализа выявлено наличие статистических связей между переменными и оценена степень их тесноты, переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. Для этого подбирают класс функций, связывающий результативный показатель у и аргументы х 1 , х 2 ,… х k , отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров связи и анализируют свойства полученного уравнения.

Функция, описывающая зависимость среднего значения результативного признака у от заданных значений аргументов, называется функцией (уравнением) регрессии . Регрессия – линия, вид зависимости средней результативного признака от факторного.

Наиболее разработанной в теории статистики является методология парной корреляции, рассматривающая влияние вариации факторного признака х на результативный у

Уравнение прямолинейной корреляционной связи имеет вид: .

Параметры а 0 и а 1 называют параметрами уравнения регрессии.

Для определения параметров уравнения регрессии используется способ наименьших квадратов, который даёт систему двух нормальных уравнений:

Решая эту систему в общем виде, можно получить формулы для определения параметров уравнения регрессии: ,

УПРАЖНЕНИЯ

Задача 9.1. 15 заводов проранжированы в порядке возрастания рентабельности производства.

№ предприятия	Рентабельность производства, %	Выработка одного работающего, т / чел	Себестоимость единицы продукции, руб.

Установите наличие и форму корреляционной связи между рентабельностью производства и выработкой, рентабельностью производства и себестоимостью единицы продукции с помощью методов статистических графиков и регрессионного анализа.

1. Курс теории статистики для подготовки специалистов финансово-экономического профиля: учебник/ Салин В. Н. - М. : Финансы и статистика, 2006. - 480 с.

2. Общая теория статистики: учебник для студентов вузов / М. Р. Ефимова, Е. В. Петрова, В. Н. Румянцев. - 2-е изд., испр. и доп. - М. : ИНФРА-М, 2006. - 414 с.

3. Практикум по общей теории статистики: учебное пособие / М.Р. Ефимова, О.И. Ганченко, Е.В. Петрова. - Изд. 3-е, перераб. и доп. - М. Финансы и статистика, 2007. - 368 с.

4. Практикум по статистике / А.П. Зинченко, А.Е, Шибалкин, О.Б. Тарасова, Е.В. Шайкина; Под ред. А.П. Зинченк. – М.: КолосС, 2003. – 392 с.

5. Статистика: Учебник для студ. учреждений сред. проф. образования / В.С. Мхитарян, Т.А. Дуброва, В.Г. Минашкин и др.; Под ред. В.С. Мхитаряна. – 3-е изд., стер. – М.: Издательский центр «Академия», 2004. -272 с.

6. Статистика: учебник для студентов вузов / Санкт-Петербург. гос. ун-т экономики и финансов; под ред. И. И. Елисеевой. - М. : Высшее образование, 2008. - 566 с.

7. Теория статистики: учебник для студентов экономических специальностей вузов / Р. А. Шмойлова [и др.] ; ред. Р. А. Шмойлова. - 5-е изд. - М. : Финансы и статистика, 2008. - 656 с.

При изучении различных экономических явлений постоянно сталкиваемся с причинно-следственными связями, когда некоторые явления, именуемые причинами, порождают другое явление, именуемое следствием (результатом). Причины будем называть факторными признаками или просто факторами, а результат – результативным признаком. Изучение и измерение связей между причинами и следствием проводятся с помощью статистических методов.

Основной задачей корреляционного анализа является измерение тесноты связи между переменными (случайными величинами) путем точечной и интервальной оценок соответствующих коэффициентов (характеристик).

С помощью корреляционного анализа производиться отбор факторов, оказывающих наиболее существенное влияние на результативный признак (на основании степени связи между ними), обнаружение ранее неизвестных причинных связей.

Корреляция непосредственно не выявляет причинных связей между переменными, но устанавливает численное значение тесноты этих связей и достоверность суждений об их наличии.

Пусть требуется изучить влияние на экономический показатель Y факторов X 1 ,X m .

Рассматривая зависимость между результативным показателем Y и факторными признаками X 1 ,X m , можно выявить две категории связей:

1) Функциональную зависимость;

2) Корреляционную зависимость;

Функциональные связи характеризуются полным соответствием между изменением факторных признаков и изменением результативной величины, то есть каждому конкретному набору значений факторов соответствует определенное значение результативного признака.

В экономике имеем дело, как правило, с явлениями и процессами, где нет таких жестких связей. Причинная обусловленность экономических явлений связана с огромной совокупностью взаимозависимых обстоятельств. Число обстоятельств (факторов), которые влияют на исследуемый экономически показатель, достигает несколько сотен.

Связь между причинами и следствием многозначна и носит вероятностный характер. В данном, случаем имеет место корреляционная зависимость.

В корреляционных связях между измерением факторов и результативного признака нет полного соответствия. Воздействие отдельных факторов проявляется лишь в среднем при массовом наблюдении фактических данных. Дело в том, что выделенные факторы не являются единственной причиной изменения результативного показателя. Наряду с ним на величину Y влияет множество других причин.

Поэтому для одного и того же набора значений факторов значение Y может оказаться различным. Таким образом, одновременное воздействие на изучаемый признак Y большого количества самых разнообразных факторов приводит к тому, что одному набору значений факторов соответствует целое распределение значений результативного признака Y .

При сравнении функциональных и корреляционных зависимостей следует иметь ввиду, что при наличии функциональной зависимости можно, зная значение факторов, точно определить величину Y . При наличии же корреляционной зависимости устанавливается лишь тенденция изменения Y при изменении факторов.

При исследовании корреляционных зависимостей необходимо:

1) Установить факт наличия связи, определить ее направления и форму;

2) Измерить степень тесноты связи между признаками;

3) Найти аналитическое выражение связи, то есть построить регрессионную модель;

4) Оценить адекватность модели и дать ее интерпретацию.

Для того, чтобы результаты корреляционного анализа дали желаемый результат, должны выполняться определенные требования в отношении отбора объекта исследования и признаков-факторов. Одним из важнейших условий правильного применения методов корреляционного анализа являются требования односторонности тех объектов, которые подвергаются изучению. Другим важным требованием, обеспечивающим надежность выводов корреляционного анализа, является требование достаточного числа наблюдений. Кроме того, большое значение имеет отбор факторов, оказывающих влияние на результативный показатель. Включаемые в рассмотрение факторы-признаки должны быть по возможности независимыми друг от друга, так как наличие тесной связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и в значительной мере дублируют друг друга.

Следует заметить, что все основные положения корреляционного анализа разработаны в предположении о нормальном характере распределения рассматриваемых признаков (случайных величин). В действительности сталкиваемся с теми или иными отклонениями от исходных предпосылок. Но это не означает, что следует отказаться от применения методов корреляционного анализа.

В корреляционном анализе различают следующие варианты зависимостей:

1) Парную корреляцию – связь между двумя признаками (результативным и факторным или двумя факторными);

2) Частную корреляцию – зависимость между результативным и одним факторным признаками при фиксированных значениях других факторных признаков;

3) Множественную корреляцию – зависимость между результативным и двумя и более факторными признаками.

Конец работы -

Эта тема принадлежит разделу:

Предмет, задачи и методы эконометрики

Цели и задачи изучения темы.. изучить предмет задачи и методы эконометрики.. основные понятия эконометрики измерения в экономике наблюдение сводка и группировка статистических данных..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Наблюдение, сводка и группировка статистических данных
Объект наблюдения – явление или совокупность явлений, информацию о которых собирают в процессе наблюдения. В зависимости от цели наблюдения объектами наблюдения могут стать различные территории, от

Цели и задачи изучения темы
изучить понятия статистического ряда распределения, вариационного ряда распределения (дискретного/интервального); исследовать статистическое распределение выборки; определять величины интервала; из

Статистическим распределением выборки
Статистическим распределением выборкиназывают перечень вариант и соответствующих им частот (или относительных частот). Статистическое распределение выборки можно задать в виде таблицы, в п

Определение величины интервала. Формула Стерджесса
Величина интервала - разность между наибольшим и наименьшим значениями признака в каждой группе, называемыми границами интервала.

Графический способ изображения статистических данных
Графическим способом изображения статистических данных называют их условное изображение при помощи точек, линий, плоскостей, геометрических фигур и условных знаков. Графики в статистике применяются

Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистический ряд распределения представляет собой упорядоченн

Цели и задачи изучения темы
изучить абсолютные и относительные величины; средние величины (понятие средней величины, формула степенной средней, формула средней геометрической, свойство мажорантности средних, мода, медиана, фо

Абсолютные и относительные величины
В результате статистического наблюдения, сводки и группировки собранного статистического материала получена разносторонняя информация об изучаемых процессах и явлениях. Итоговые данные по изучаемой

Средние величины
Средняя величина представляет собой обобщенную характеристику совокупности однородных явлений по какому-либо одному количественно варьируемому признаку. Средние величины играют важную роль

Показатели вариации признака
Под вариациейв статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различны

Различают два вида обобщающих показателей, характеризующих количественную сторону исследуемых явлений и процессов: абсолютные и относительные. Абсолютные показатели - именованные числа, им

Законы распределения случайных величин

Числовые характеристики случайных величин
Закон распределения полностью характеризует случайную величину. Однако он часто неизвестен. В ряде случаев даже удобнее пользоваться числами, которые описывают случайную величину суммарно. Такие чи

Экономические показатели, как правило, являются случайными величинами. Случайной величиной называется величина, которая в результате опыта (испытания) может принять одно и только одно возм

Закон равномерной плотности
На практике встречаются непрерывные случайные величины, о которых заранее известно, что их возможные значения лежат в пределах некоторого определенного интервала. Кроме того, известно, что в предел

Показательное распределение
Показательным (экспоненциальным) называют распределение вероятностей величины Х, которое описывается плотностью

Нормальный закон распределения
Нормальный закон распределения (закон Гаусса) характеризуется плотностью В экономике часто вст

Усеченные законы распределения
Пусть случайная величина Химеет функцию распределения F(x), заданную на всей числовой оси. Выберем на этой оси интересующий нас отрезок }