Что значит положительная автокорреляция

Понятие и причины автокорреляции остатков. Последствия автокорреляции остатков. Обнаружение автокорреляции остатков

Автокорреляции остатков наблюдается тогда, когда значения предыдущих остатков завышают (положительная) или занижают (отрицательная) значения последующих.

Положительная автокорреляция на графике остатков проявляется в чередовании зон положительных и отрицательных остатков:

Отрицательная автокорреляция на графике выражается в том, что остатки «слишком часто» меняют знак:

Основными причинами автокорреляции являются:

неправильный выбор формы регрессионной зависимости;

неучет в модели одного или нескольких важных факторов;

цикличность значений экономических переменных при построении модели по временным данным.

Автокорреляция может привести к ошибочному выводу о несущественном влиянии исследуемого фактора на результат Y, в то время как на самом деле влияние фактора на Y значимо.

Для обнаружения автокорреляции остатков используется d-статистика Дарбина–Уотсона:

Значение d-статистики сравнивается с критическими значениями d1 и d2. При этом могут возникнуть следующие ситуации:

если , то остатки признаются некоррелированными;

если , то имеется положительная автокорреляция;

если , то существует отрицательная автокорреляция;

если или , то это указывает на неопределенность ситуации.

d‑статистика рассчитывается либо по временному ряду остатков, либо по упорядоченному в зависимости от последовательно возрастающих или убывающих расчетных значений Y.

При неопределенности ситуации рассчитывается коэффициент автокорреляции остатков первого порядка

Автокорреляция отсутствует, если коэффициент не превышает по модулю критическое значение. В противном случае делают вывод о наличие автокорреляции: положительной при или отрицательной при .

Продолжение примера 3. d‑статистика имеет значение d=3,44. Критические значения составляют d1=0,66 и d2=1,86 (=0,05; p=3; n=12). d‑статистика попадает в интервал , что свидетельствует об отрицательной автокорреляции остатков.

Коэффициент автокорреляции остатков первого порядка r(1)=–0,721 превышает по модулю критическое значение rкр=0,576 (=0,05; n=12), что еще раз свидетельствует об отрицательной автокорреляции остатков.

Источник

Сущность и последствия автокорреляции

Автокорреляция – это корреляционная зависимость между текущими значениями некоторой переменной и значениями этой же переменной, сдвинутыми на несколько периодов времени назад. Автокорреляция случайной составляющей e модели – это корреляционная зависимость текущих и предыдущих значений случайной составляющей модели. Величина l называется запаздыванием, сдвигом во времени или лагом.

Автокорреляция случайных возмущений модели нарушает одну из предпосылок регрессионного анализа: условие

Автокорреляция может быть вызвана несколькими причинами, имеющими различную природу. Во-первых, иногда она связана с исходными данными и вызвана наличием ошибок измерения в значениях результирующей переменной. Во-вторых, в ряде случаев причину автокорреляции следует искать в формулировке модели. Модель может не включать фактор, оказывающий существенное воздействие на результат, влияние которого отражается на возмущениях, вследствие чего последние могут оказаться автокоррелированными. Очень часто этим фактором является фактор времени t: автокорреляция обычно встречается при анализе временных рядов.

Постоянная направленность воздействия не включенных в модель переменных является наиболее частой причиной так называемой положительной автокорреляции.

Иллюстрацией положительной автокорреляции может служить следующий пример.

Пример 5.2. Пусть исследуется спрос Y на прохладительные напитки в зависимости от дохода X по ежемесячным и сезонным наблюдениям. Зависимость, отражающая увеличение спроса с ростом дохода, может быть представлена линейной функцией регрессии y = ax + b, изображенной вместе с результатами наблюдений на рис. 5.2.

Рис. 5.2. Положительная автокорреляция

На величину спроса Y оказывают влияние не только доход X (учтенный фактор), но и другие факторы, которые не учтены в модели. Одним из таких факторов является время года.

Положительная автокорреляция означает постоянное в одном направлении действие неучтенных факторов на результирующую переменную. Так спрос на прохладительные напитки всегда выше линии регрессии летом (т.е. для летних наблюдений e > 0) и ниже зимой (т.е. для зимних наблюдений e

Рис. 5.3. Отрицательная автокорреляция

Последствия автокорреляции в определенной степени сходны с последствиями гетероскедастичности. Среди них при применении МНК обычно выделяют следующие.

1. МНК-оценки параметров, оставаясь несмещенными и линейными, перестают быть эффективными. Следовательно, они перестают обладать свойствами наилучших линейных несмещенных оценок.

2. Стандартные ошибки коэффициентов регрессии будут рассчитываться со смещением. Часто они являются заниженными, что влечет за собой увеличение t-статистик. Это может привести к признанию статистически значимыми объясняющих переменных, которые в действительности таковыми не являются. Смещенность возникает вследствие того, что выборочная остаточная дисперсия (m – число объясняющих переменных модели), которая используется при вычислении указанных величин (см. формулы (2.18) и (2.19)), является смещенной. Во многих случаях она занижает истинное значение дисперсии возмущений s 2 .

Вследствие вышесказанного все выводы, получаемые на основе соответствующих t— и F— статистик, а также интервальные оценки будут ненадежными. Следовательно, статистические выводы, получаемые при проверке качества оценок (параметров модели и самой модели в целом), могут быть ошибочными и приводить к неверным заключениям по построенной модели.

Источник

Автокорреляция. Положительная и отрицательная. Последствия автокорреляции

Кроме проверки значимости коэффициентови качества уравнения регрессии в целом необходима, проверка выполнения условий Гаусса-Маркова, обеспечивающих несмещенность и эффективность оценок параметров регрессии.

Напомним, что при выполнении условия E(ei)=0, i=1,2. n, требование некоррелированности случайных членов cov(ei,ej)=0, i≠j, может быть записано в виде

При нарушении этого условия, т.е. при наличии связи между случайными членами возникает явление автокорреляции. Явление автокорреляции характерно временных рядов, для которых наблюдения жестко упорядочены, и порядок их расположения несет в себе важную информацию.

В случае положительной автокорреляции реализации случайного члена ei для ряда последовательных наблюдений смещают значения зависимой переменной в одном направлении, затем для нескольких последовательных наблюдений – в противоположном направлении, потом снова в первоначальном направлении и т.д.

В экономике положительная автокорреляция может быть связана с циклами деловой активности, с сезонными колебаниями, влияние которых и отражается в случайном члене уравнения регрессии.

При отрицательной автокорреляции каждая реализация случайного члена ei, как правило, сменяется реализаций случайного члена ei+1 противоположного знака.

Для экономики обычно характерно возникновение положительной автокорреляции. Появление автокорреляции более вероятно для малых временных промежутков между наблюдениями.

В случае автокорреляции возмущенной ei ковариационная матрица V(e)=Ω не будет диагональной:

Ω= (s21 s² … s2n) , sij = cov(ei, ej)

Так же как при наличии гетероскедастичности показывается, что оценка вектора коэффициентов β модели множественной линейной регрессии остается несмещенной, но оценка дисперсии возмущенной оказывается смещенной. Значит, все вычисляемые t-статистики коэффициентов будут неправильными, что вполне может привести к неправильным выводам.

Источник

Автокорреляция (Autocorrelation)

Автокорреляция (последовательная корреляция) – сила взаимосвязи Наблюдений (Observation) во Временном ряду (Time Series). Коррелограммы – графики автокорреляции и частичной автокорреляции, широко используются при анализе и прогнозировании временных рядов.

Пример. Используем Датасет (Dataset) минимальных суточных температур за 10 лет (1981–1990) в г. Мельбурн, Австралия. Единицы измерения – градусы Цельсия, всего 3650 наблюдений. Для начала импортируем необходимые библиотеки:

Получим токен Google Cloud SDK, чтобы использовать Google-таблицу:

Загрузим набор данных:

Визуализируем данные, чтобы увидеть сезонные колебания:

График набора данных минимальных суточных температур

Температуры в данном случае – серия Pandas, и создается линейный график временного ряда.

Корреляция и автокорреляция

Статистическая корреляция отображает силу взаимосвязи между двумя переменными.

Мы можем предположить, что распределение каждой переменной соответствует распределению Гаусса (кривая колокола). В этом случае мы можем использовать Коэффициент корреляции Пирсона (Pearson Correlation Coefficient), чтобы суммировать корреляцию между переменными.

Коэффициент корреляции Пирсона – это число от -1 до 1, которое описывает отрицательную или положительную корреляцию соответственно. Нулевое значение указывает на отсутствие корреляции.

Мы можем вычислить корреляцию для наблюдений временного ряда, используя n-ное и (n-1)-е наблюдения. Последние еще называют лагами. Поскольку корреляция наблюдений временного ряда вычисляется со значениями того же ряда в предыдущие моменты времени, это еще называется последовательной корреляцией.

График автокорреляции временного ряда (AutoCorrelation Function – ACF) иногда называют коррелограммой. Давайте построим такой с помощью функции plot_acf() библиотеки statsmodels:

Коррелограмма датасета минимальных суточных температур

При исполнении кода ячейки создается двухмерный график, демонстрирующий корреляцию между двумя временными рядами – исходным и сдвинутым на один день назад. Мы ограничили количество значений по оси x до 35, чтобы улучшить читаемость графика.

Поскольку температурная разница между 1 и 2-м июля, очевидно, небольшая, то и корреляция будет стремиться к единице (второй столбец графика слева). Но когда мы исследуем разницу температур между 1 июля и 4 августа (35 дней разницы – крайний столбец слева), коэффициент корреляции очевидно будет меньше.

Если вы хотите ознакомиться с пошаговой последовательностью построения графика автокорреляции, посмотрите обучающее видео от Brandon Rohrer.

Пошаговая процедура построения коррелограммы

Доверительные интервалы изображены в виде полупрозрачного голубого конуса. По умолчанию установлен доверительный интервал 95%. Если голубая точка каждого из 35 коэффициентов лежит за пределами этой фигуры, то является статистически значимой единицей.

Частичная автокорреляция

Частичная автокорреляция (Partial Autocorrelation – PACF) – это сводка отношений между наблюдением во временном ряду с наблюдениями на предыдущих временных шагах с удаленными взаимосвязями промежуточных наблюдений. Частичная автокорреляция при лаге k возникает после устранения влияния любых корреляций с более короткими лагами.

Автокорреляция для наблюдения и наблюдения на предыдущем временном шаге состоит как из прямой корреляции, так и из косвенной корреляции. Эти косвенные корреляции являются линейной функцией корреляция наблюдения с наблюдениями на промежуточных временных шагах.

Именно эти косвенные корреляции пытается устранить функция частичной автокорреляции. Построим такой график для нашего температурного датасета:

При выполнении примера создается двухмерный график частичной автокорреляции для первых 50 лагов:

График частичной автокорреляции датасета минимальных суточных температур

Ноутбук, не требующий дополнительной настройки на момент написания статьи, можно скачать здесь.

Источник

Читайте также:  Георгиевская ленточка что значит для вас
Оцените статью