Оценка адекватности модели

Модели авторегрессии и скользящего среднего

Метод эволюции

С целью повышения адаптации параметра сглаживания к изменениям в динамике ряда предлагались модификации алгоритмов. Например, для однопараметрической модели предлагается использовать не один неизменный параметр сглаживания, а три различных параметра, называемых соответственно нормальным значением - α, низким значением – (α-h), высоким значением – (α+h), где h- шаг изменения параметра. Оценка, полученная при нормальном значении параметра, считается прогнозной, а две другие оценки считаются контрольными. Таким образом, при реализации алгоритма на каждом шаге получается не одна оценка следующего уровня, а три.

Далее сравнивают фактическое значение уровня временного ряда с расчетными и определяют значение параметра, давшего наименьшую ошибку. На следующем шаге это значение параметра берется в качестве нормального. И от нового нормального значения параметра сглаживания строятся новые низкое и высокое значения (α±h).

Таким образом, первоначально выбранное значение параметра сглаживания постоянно изменяется, причем его изменение носит компенсирующий характер и направлено на скорейшее устранение постоянно возникающих ошибок прогнозирования. Для стабильности прогностической системы накладывается ограничение на значения параметров:

0,05≤ α-h, α, α+h ≤0,95.

Отбор лучших значений параметров сглаживания аналогичен процессу естественного отбора, поэтому данный метод получил название эволюционного планирования.

Рассмотренный подход получил дальнейшее развитие для модели Хольта-Уинтерса с аддитивным коэффициентом роста и мультипликативной сезонностью. При трех управляемых параметрах в каждый момент времени вычисляется девять оценок будущего наблюдения. Одна из оценок, соответствующая точке, координаты которой отвечают «нормальным» значениям параметров сглаживания, считается прогнозной. Анализ точности пробных оценок дает возможность принять решение об изменении нормальных значений параметров с соответствующей корректировкой набора низких и высоких значений параметров.

Как отмечают отдельные авторы, метод эволюции дает более точные прогнозы для рядов, характеризующихся высокой автокорреляцией, чем модель Уинтерса.

Учет авторегрессионных свойств исходных временных рядов и производных от него разностных рядов существенно расширил возможности применения адаптивных моделей. Это направление развития адаптивных методов показано в работах Дж. Бокса и Г. Дженкинса. Дж. Бокс и Г. Дженкинс предложили методику построения модели, включающей не только модель скользящего среднего, как это имеет место в экспоненциальных моделях, но и авторегрессионную модель.

Рассмотрим понятия и основные модели, лежащие в основе построения модели Бокса-Дженкинса.

Во временном ряде, как правило, присутствует нерегулярная случайная компонента, поведение которой точно предсказать заранее нельзя. Для описания нерегулярной компоненты и всего временного ряда в целом используют понятие случайного (стохастического) процесса.

Случайные процессы представляют собой совокупности случайных величин в динамике их развития. Это те же массовые явления, которые изучаются в теории вероятностей, но рассматриваются они не в виде однородного массива случайных чисел, а как последовательность чисел в хронологии появления величин, которым они соответствуют. Случайный процесс можно рассматривать либо как совокупность реализаций процесса , либо как совокупность случайных величин, зависящих от параметра t.

Случайные процессы разделяются на процессы с непрерывным и с дискретным временем. В последнем случае они представляют собой временные ряды. Если число наблюдений во временном ряду ограничено, то случайный процесс – это просто совокупность случайных величин, для статистического описания которой надо указать распределение вероятностей в конечномерном пространстве.

В теоретических исследованиях и практических задачах важную роль играют случайные процессы, вероятностные свойства которых не изменяются во времени. Вполне логично назвать их стационарными.

Случайный процесс называется стационарным, или стационарным в строгом смысле, если совместное распределение вероятностей m наблюдений такое же, что и для m наблюдений при любых m, t1, t2,…,tm, τ.

Под стационарностью в широком смысле понимается стохастический процесс, для которого среднее значение и дисперсия независимо от времени имеют постоянное значение, а ковариации зависят только от длины лага τ между рассматриваемыми наблюдениями:

,

.

Ковариация между значениями , отделенными интервалом времени τ, называется автоковариацией с лагом τ и определяется как

.

При τ=0 ее значение равно дисперсии.

Загрузка...

Очевидно, что из строгой стационарности следует слабая стационарность, а не наоборот.

Белым шумом называют случайный процесс с нулевым средним, если составляющие его величины независимы и распределены одинаково при всех t. Это значит, что

,

,

.

Включив в определение белого шума предположение о нормальности распределения величин, получим понятие так называемого гауссовского белого шума. Другими словами, гауссовский белый шум – это последовательность независимых нормально распределенных случайных величин со средним µ=0 и общей дисперсией σ2.

Пример белого шума изображен на рис. 5.4.

Рис. 5.4. Белый шум

Белый шум является частным случаем стационарного ряда. На практике процессы белого шума в чистом виде встречаются не часто, но они играют фундаментальную роль в прикладном анализе временных рядов. Из временного ряда исключают тренд, циклическую и сезонную компоненты, так чтобы остаток не отличался от белого шума.

Введем еще одно понятие, которое необходимо при оценивании параметров модели стохастического процесса. При оценивании характеристик случайных процессов, таких как математическое ожидание, дисперсия и другие обычно подразумевают, что в каждый заданный момент времени имеют всю генеральную совокупность случайной величины, соответствующую этому моменту времени. Однако в нашем распоряжении - одна единственная реализация. Поэтому любая статистика, которую мы будем рассматривать, может быть определена по одной реализации, а не по повторяющейся выборке. Разбросанные в разные моменты времени значения временного ряда должны составить такую же качественную выборку, как повторная выборка в один и тот же момент времени. Процессы, которые обладают таким свойством, называют эргодическими (ergodik). Недостаточно для процесса быть стационарным, нужно чтобы процесс был эргодическим.

Эргодичность - это свойство, позволяющее для оценки математического ожидания использовать усреднение по времени (по реализации). Если имеется достаточно длинная реализация, то можно заменить усреднение по множеству, усреднением по времени.

Для того чтобы стационарный процесс был эргодичным, достаточно чтобы выполнялось следующее условие:

.

Стационарные процессы авторегрессии и скользящего среднего обладают свойством эргодичности, нестационарный процесс не может быть эргодическим. Но не всякий стационарный процесс эргодичен, хотя для практических целей наличие стационарности неявно подразумевает эргодичность. Таким образом, эргодичность делает возможным оценивание математического ожидания, дисперсии и ковариации стохастического процесса только по его реализации – временному ряду.

Для описания стохастических процессов широко используются авторегрессионные модели (АR-модели, от английского слова Autoregressive processes). Основная предпосылка построения авторегрессионных моделей заключается в использовании одного из важнейших свойств временных рядов экономических процессов, а именно - взаимозависимости уровней одного и того же ряда друг от друга.

В авторегрессионных моделях текущее значение уровня ряда представляется как линейная комбинация предыдущих его значений и случайной компоненты:

. (5.8)

Информационная ценность наблюдений определяется не их близостью к моделируемому уровню, а теснотой связи между ними. Если текущее значение уровня зависит от р предыдущих значений, то имеем авторегрессионный процесс порядка р, который будем обозначать АR(р).

При построении авторегрессионных моделей исходят из предположения о том, что моделируемый процесс является стационарным.Многие временные ряды могут быть приведены к стационарному ряду после выделения тренда, сезонной компоненты или путем взятия разности соседних значений ряда. Переход от нестационарного ряда к стационарному путем взятия разностей называется интегрированием.

Обозначим через Δ оператор перехода от исходного ряда к разностному ряду: .

Первоначальный ряд называется интегрированным рядом первого порядка, если его первые разности составляют стационарный временной ряд. Если для получения стационарного ряда требуется рассчитать вторые разности, то исходный временной будет называться интегрированным рядом второго порядка и так далее. Исходный стационарный временной ряд называют интегрированным рядом нулевого порядка.

Например, если курс акций компании линейно возрастает, то соответствующий временной ряд представляет собой интегрированный ряд первого порядка, а временной ряд, отображающий доходность этой компании будет интегрированным рядом нулевого порядка.

Важно отметить, что дисперсия стационарного временного ряда конечна, а дисперсия интегрированного временного ряда первого порядка и выше с течением времени возрастает до бесконечности.

Обозначим через В – оператор сдвига назад , то есть действие оператора сдвига на временной ряд дает значение временного ряда в предыдущий момент времени; последовательное применение оператора сдвига m раз дает значение временного ряда на m периодов ранее ;

φ - оператор авторегрессии,

тогда выражение (5.8) можно записать как

или

.

Так как любой многочлен степени р с действительными коэффициентами имеет р комплексных корней, то для операторного многочлена вида можно определить характеристическое уравнение

или ,

где z – комплексное число.

Для выполнения условия стационарности процесса необходимо и достаточно, чтобы все комплексные корни характеристического уравнения лежали вне единичного круга, т.е. .

Простейший вариант авторегрессионного процесса - модель авторегрессии первого порядка:

, (5.9)

где α – коэффициент, не превосходящий по абсолютной величине единицу ;

- последовательность случайных величин образующих белый шум.

В соответствии с определением «белого шума» ошибка - характеризуется следующими свойствами:

,

,

Модель (5.9) называют также марковским процессом. Рассмотрим основные свойства марковского процесса.

Представим выражение (5.9) в виде

Из выражения видно, что текущее значение наблюдения зависит от всех предыдущих ошибок . Так как среднее значение «белого шума» равно нулю , то .

Дисперсия марковского процесса определяется как:

. (5.10)

Из выражения (5.10) следует, что при близком к единице дисперсия будет намного больше дисперсии белого шума . Это значит, что в случае сильной корреляции последовательных значений ряда , даже слабые возмущения будут порождать размашистые колебания .

Автоковариационная функция определяется:

,

следовательно, автокорреляционная функция как

.

Степень тесноты корреляционной связи между уровнями ряда экспоненциально убывает по мере их взаимного удаления друг от друга по времени. Значение первого коэффициента автокорреляции равно и все автокорреляции марковского процесса можно выразить через автокорреляцию первого порядка.

Значения частной автокорреляционной функции равны нулю для всех лагов τ=2,3,… Это свойство можно использовать при подборе модели, если выборочные частные коэффициенты автокорреляции статистически незначимо отличаются от нуля при τ۟≥2, то использование модели авторегрессии первого порядка не противоречит исходным данным.

Характеристическое уравнение для модели авторегрессии первого порядка имеет вид:

.

Исходя из требования к корням характеристического уравнении , определяются требования к коэффициенту α: .

Процесс случайного блуждания или броуновское движение задается моделью:

, (5.11)

где - белый шум. Этот процесс можно рассматривать как авторегрессию первого порядка с коэффициентом α=1. Математическое ожидание случайного блуждания , т.е. математическое ожидание удовлетворяет условию стационарности. Дисперсия случайного блуждания равная не постоянна, она меняется со временем, более того она растет пропорционально времени. Поэтому процесс случайного блуждания является нестационарным.

Процессы с |α|>1 также нестационарные. Такие ряды маловероятны в реальных финансово-экономических процессах, так как это подразумевает взрывные ряды, а давление экономической среды не позволяет показателям принимать бесконечно большие значения.

Перепишем уравнение (5.11) в виде

или .

Первую разность процесса случайного блуждания можно рассматривать как другой временной ряд , который будет стационарным.

Модель авторегрессии второго порядка (процессы Юла) определяется выражением

,

где - последовательность случайных величин образующих белый шум.

Можно получить систему уравнений, связывающих между собой параметры модели α1, α2 с дисперсией и первыми двумя ковариациями моделируемого процесса:

.

Разделив оба уравнения на , получим:

, или

. (5.12)

Эта систему называют системой Юла-Уокера (Yule Walker). Разрешая систему (512) относительно и получим:

Из системы (5512 можно выразить два первых коэффициента автокорреляции:

(5.13)

Используя рекуррентное соотношение

можно вычислить значения автокорреляционной функции процесса Юла для τ=3,4,….

Соотношение, связывающее между собой дисперсию моделируемого процесса и дисперсию белого шума имеет вид:

Условия стационарности процесса Юла могут быть получены из естественных требований к первым двум коэффициентам автокорреляции :

.

Откуда следуют необходимые и достаточные условия стационарности данного процесса:

. (5.14)

Те же самые условия стационарности получаются из требования, чтобы все корни характеристического уравнения лежали вне единичного круга.

Из условий стационарности (5.14) и выражений (5.13) для следует, что не всякие значения подходят для описания процесса Юла. Допустимые значения должны удовлетворять неравенствам:

.

Частная автокорреляционная функция процесса Юла начиная с лага τ=3,4,… будет равна нулю. Отметим, что этот результат верен для теоретической частной автокорреляционной функции и может не выполняться для выборочной частной автокорреляционной функции. На практике следует ожидать резкое убывание ЧАКФ до значений, близких к нулю при лагах выше 2.

Рассмотрев свойства авторегрессионных моделей, сформулируем практические рекомендации по их идентификации, основанные на изучении АКФ и ЧАКФ.

1. У моделей авторегрессии АR(р) значения коэффициентов АКФ экспоненциально затухают (либо монотонно, либо попеременно меняя знак);

2. ЧАКФ для моделей авторегрессии АR(р) имеет выбросы на первых р- лагах, а значения коэффициентов для лагов, больших порядка авторегрессии, они статистически незначимы. Это свойство ЧАКФ используется при подборе порядка р в модели авторегрессии для конкретных анализируемых рядов.

Построение модели АR(р), адекватной реальному временному ряду, предполагает решение двух взаимосвязанных задач: определение порядка модели (величины р) и оценки значений ее коэффициентов.

Рекуррентное соотношение, позволяющее последовательно вычислять любой коэффициент АКФ АR-процесса по ее первым коэффициентам имеет вид:

. (5.15)

Последовательно подставляя в (5.15) вместо истинных значений коэффициентов автокорреляции процесса их выборочные оценки , получим следующую систему линейных уравнений:

,

в которой известными являются оценки коэффициентов автокорреляции , а неизвестными – оценки коэффициентов модели АR(р) . Эта система уравнений Юла-Уокера, частный случай этих уравнений рассмотрен в АR(2)- процессах. Полученные на ее основе значения называют оценками коэффициентов модели авторегрессии АR(р) Юла-Уокера. Оценки могут быть получены либо с использованием определителей либо на основе векторно-матричной формы записи системы.

В моделях скользящей средней (МА-модели, от английского слова Moving average) моделируемая величина задается в виде линейной функции от прошлых ошибок, т.е. от разности между прошлыми фактическими и прошлыми смоделированными наблюдениями:

, (5.16)

где - белый шум.

При моделировании процесса МА исходят из предпосылки, что в ошибках модели за несколько предшествующих периодов сосредоточена информация обо всей предыстории временного ряда.

Временной ряд можно представить в виде взвешенной суммы настоящего и прошлых значений белого шума (уравнение (5.16)) и в виде линейной модели (5.8), в которой в качестве объясняющих переменных выступают его собственные значения во все прошлые моменты времени. Переход от модели (5.16) к модели (5.8) осуществляется с помощью последовательной подстановки в правую часть (5.16) вместо их выражений вычисленных в соответствии с (5.16) для моментов времени t-1, t-2,… и т.д. Уравнение (5.16) можно записать в виде:

.

Это означает двойственность в представление анализируемого ряда (две эквивалентные формы линейного процесса) и обратимость АR и МА процессов.

В моделях скользящего среднего не требуется накладывать никаких ограничений на параметры для обеспечения стационарности ряда. Но при этом для выполнения условия обратимости процесса (представления в виде модели авторегрессии бесконечного порядка), необходимо, чтобы коэффициенты в (5.16) образовывали сходящийся ряд, т.е. .

Это же условие обратимости МА-модели, т.е. условие сходимости ряда, в терминах характеристического уравнения формулируется следующим образом:

все корни характеристического уравнения , где z – комплексное число, должны лежать вне единичного круга, т.е. .

Процесс МА всегда стационарен, а условия обратимости, накладывая некоторое свойство, не затрагивают фундаментального свойства стационарности. Для процесса АR условие более жесткое, либо процесс стационарен и тогда он сводится к процессу МА, либо он вообще не стационарен.

С помощью оператора сдвига назад (В) процесс скользящего среднего МА(q) записать следующим образом:

или

где θ - оператор скользящего среднего.

В соответствии с определением «белого шума» ошибка - характеризуется следующими свойствами:

,

,

Процесс МА(q) имеет следующие свойства:

,

,

Среднее, дисперсия и ковариация процесса МА(q) не зависят от времени, следовательно, процесс МА(q) стационарен в широком смысле.

Автокорреляционная функция модели скользящего среднего порядка q, определяется через ее параметры следующим образом:

(5.17)

Из последнего соотношения вытекает важное характеристическое свойство модели скользящего среднего: автокорреляционная функция процесса МА(q) становится равной нулю после лага τ=q.

Система из q уравнений (5.17) может служить основой для получения оценок неизвестных параметров модели . Однако в отличие от уравнений Юла-Уокера эта система нелинейная и ее решение основано на применении специальных итеративных процедур расчетов, за исключением модели первого порядка.

Рассмотрим модель скользящего среднего первого порядка МА(1):

,

где - белый шум.

Как было отмечено ранее, для обратимости процесса необходимо выполнение условия . Среднее и дисперсия процесса МА(1): , .

Единственный отличный от нуля первый коэффициент автокорреляции определяется через коэффициент модели как

.

Частная автокорреляционная функция процесса МА(1) определяется выражением

.

ЧАКФ для МА(1) процесса экспоненциально убывает. Если , то параметр , следовательно, осциллирует с переменным знаком. Если , то параметр , следовательно, все значения отрицательны.

Таким образом, имеет место некоторая симметрия, пара графиков АКФ и ЧАКФ для МА-процесса имеет такой же вид, как пара графиков (ЧАКФ и АКФ) для АR-процесса.

На практике часто используются комбинированные модели, сочетающие авторегрессионный процесс с моделью скользящей средней или к ним еще добавляется процедура интегрирования. В первом сочетании такие модели называются авторегрессионными моделями скользящей средней (Autoregressive-Moving Average (ARMA-модели). Они имеют p временных лагов в авторегрессионном процессе и q интервалов в модели скользящей средней и определяются следующим уравнением:

.

Более коротко процесс АРМА(p,q) может быть записан в виде:

.

Стационарность процесса АRМА определяется только его АR-частью. Поэтому условия стационарности те же, что у процесса АR – процесс АRМА стационарен, если корни характеристического уравнения его АR-части лежат вне единичного круга. Точно так же, условия обратимости процесса, то есть возможность выразить через , полностью определяются условиями обратимости МА-части. Если МА-часть обратима, то и весь процесс обратим.

Если процесс АRМА стационарный, то он обязательно имеет бесконечное МА-представление или бесконечное АR-представление. То есть АRМА(p,q) являются очень удобным представлением одного и того же процесса, но с меньшим количеством параметров, всего (p+q) - параметров, что является одним из преимуществ этой модели.

Очевидно, что математическое ожидание стационарного процесса АRМА(p,q) равно нулю.

Рассмотрим простейшие процессы АRМА, например, процесс АRМА(1,1):

Условие стационарности имеет вид: , условие обратимости.

Дисперсия процесса АRMА(1,1) , его первый коэффициент автоковариации и дисперсия ошибки связаны следующими соотношениями:

,

.

Коэффициенты автоковариаций более высоких порядков связаны соотношениями вида:

.

Первый коэффициент автокорреляции процесса АRМА(1,1) определяется по формуле:

.

Коэффициенты автокорреляции более высоких порядков определяются по формуле:

, τ≥2.

Таким образом, начиная со второго коэффициента, коэффициенты автокорреляции процесса АRМА(1,1) ведут себя также как и коэффициенты автокорреляции процесса АR(1), то есть экспоненциально убывают.

Для процесса АRМА(p,q) справедливо аналогичное утверждение. Первые р-значений автокорреляционной функции определяются взаимодействием АR и МА частей, а потом значения автокорреляционной функции выражаются в виде суммы экспоненциально затухающих слагаемых. Ранее отмечалось, что для МА(q)-процесса автокорреляционная функция для лагов τ>q равна нулю. Поэтому влияние МА-части при τ>q прекращается, дальше остается влияние только АR(р). Таким же качественным поведением характеризуется и частная автокорреляционная функция АRМА(p,q). Частная автокорреляционная функция для процесса АR(р) для лагов больших чем τ>р, равна нулю, то есть АR(р) часть перестает влиять на частную автокорреляционную функции и остается только влияние МА(q).

Таким образом, можно отметить, что если процесс относится к типу АRМА(p,q), то начиная с некоторого лага, и автокорреляционная и частная автокорреляционная функции экспоненциально затухают.

Модель Бокса-Дженкинса. Бокс и Дженкинс предложили выделить класс нестационарных рядов, которые взятием последовательных разностей можно привести к стационарному виду, а именно к виду АRМА(p,q). Если ряд после взятия d последовательных разностей приводится к стационарному ряду, удовлетворяющим АRМА-модели, то имеем процесс АRIМА(p,d,q) – процесс авторегрессии-интегрированного скользящего среднего (Autoregressive Integrated Moving Average). В специальной литературе эта модель известна как модель Бокса-Дженкинса. В операторном виде АRIМА(p,d,q) записывается как:

или ,

где d – порядок разности.

Моделируемый процесс нестационарный, потому что не выполняется условие, что все корни характеристического уравнения по модулю должны быть больше единицы. Но если обозначить , то - стационарный процесс.

Модель Бокса-Дженкинса предназначена для описания нестационарных временных рядов со следующими свойствами:

1. Ряд включает в себя аддитивно составляющую , имеющую вид алгебраического полинома некоторой степени d≥1, причем коэффициенты этого полинома могут быть как стохастической, так и нестохастической природы;

2. Ряд, получившийся после применения к нему d-кратной процедуры вычисления последовательных разностей, может быть описан моделью АRМА(p,q).

Таким образом, при моделировании стохастических процессов, представленных в виде временных рядов, необходимо уметь определять уровень их автокорреляции (порядок авторегрессии - р), интегрированности (порядок предварительно определяемых разностей – d) и порядок скользящей средней (q). Очень важно выделить эти три составляющие, чтобы определить структуру моделируемого процесса.

Задачу построения АRIМА- модели Бокс и Дженкинс предложили разбить на несколько этапов.

I этап

Идентификация модели АRIМА(p,d,q), то есть определение величин p,d,q. Первый этап состоит их 2-х стадий. Первая стадия – это определение степени интегрированности (d) и, в случае необходимости, расчет разностей с целью получения стационарных рядов. На второй стадии 1-го этапа рассчитывают коэффициенты автокорреляции и частной автокорреляции и, исходя из поведения коэффициентов, устанавливают параметры p,q.

II этап

Оценивание коэффициентов и при условии, что известно p и q.

III этап

Тестирование построенной модели по остаткам. У адекватной модели остатки должны быть белым шумом, т.е. их выборочные автокорреляции не должны существенно отличаться от нуля. Окончательный выбор модели.

IV этап

Использование модели для прогнозирования.

Поясним содержание отдельных этапов. Для установления параметров модели p и q, коэффициенты автокорреляции и частной автокорреляции проверяются на значимость. Значимость коэффициентов автокорреляции проверяют при помощи критерия стандартного отклонения и Q-критерия Бокса-Пирса. Первый из названных критерий используется для определения значимости каждого коэффициента автокорреляции в отдельности. Q-критерий Бокса-Пирса применяется для проверки значимости всего множества коэффициентов как группы.

Значимость стандартного отклонения коэффициента автокорреляции рассчитывается следующим образом:

,

где n – число наблюдений,

z – критическое (двустороннее) значение вероятностей нормального распределения. Если коэффициент автокорреляции выходит за пределы , то нулевая гипотеза о равенстве нулю коэффициента автокорреляции отвергается.

Статистический критерий Q рассчитывается так:

,

где ri - коэффициент автокорреляции с i – лагом,

m – максимально рассматриваемый лаг.

При нулевой гипотезе об отсутствии автокорреляции Q-статистика имеет χ2 – распределение с υ=τ-p-q степенями свободы, где p,q – параметры АRМА-модели. Нулевая гипотеза отвергается, если расчетное значение , в этом случае первые m - коэффициентов автокорреляции значимы.

Для проверки автокорреляции в процессах с элементами авторегрессии и скользящей средней так же может быть использован критерий Льюнга-Бокса, который является модификацией критерия Бокса-Пирса. Он рассчитывается следующим образом:

,

где m – максимальное число временных лагов, рассматриваемых в модели;

p – порядок авторегрессии;

q – порядок процесса скользящей средней.

LB-статистика имеет такое же асимптотическое распределение, как и Q-статистика, однако ее распределение ближе к χ2 для конечных выборок. Если , то автокорреляция отсутствует.

Проверка необходимости применения процедуры интеграции к временному ряду, т.е. его преобразования с помощью разностей для приведения к стационарному виду, может быть проведена с использованием метода Тинтнера, либо с помощью критерия Дики-Фуллера. При использовании последнего проверяется, имеется ли в уравнении

значение коэффициента af1. Если a=1, то ряд является интегрированным рядом первого порядка, если же 0

При анализе нестационарных процессов, уравнения которых имеют порядок авторегрессии больше единицы, дисперсия yt растет вместе с ростом t, так как остатки автокоррелированы. В связи с этим следует использовать зависимость, выражающую изменение yt в следующем виде:

,

где b = (at – 1).

Если b равно нулю, то ряд является интегрированным рядом первого порядка, а ряд Dyt – стационарным. Если же b<0, т.е. a<1, то сам ряд yt является стационарным.

Оба предложенные уравнения предполагают, что моделируемые временные ряды имеют нулевое значение средней и в них отсутствует тренд. Эти предположения для временных рядов финансовых показателей выполняются крайне редко. В этих случаях, как например, при моделировании прибыли устойчиво функционирующего коммерческого банка с положительной постоянной нормой прибыли, когда среднее значение показателя положительно, указанные уравнения модифицируются следующим образом:

,

.

В случае равномерно возрастающей нормы прибыли в уравнения включают еще и тренд:

,

.

Здесь t = 1,…,n.

Проверка степени стационарности, приведенных уравнений, проводится с использованием расширенного критерия Дики-Фуллера. При использование этого критерия прошлые значения независимой переменной включаются в уравнение регрессии с лагом, достаточным для того, чтобы избавиться от автокорреляции остатков. Такое уравнение может иметь вид:

Порядок использования критерия Дики-Фуллера следующий: рассчитывается значение статистического критерия b1/Sb1, здесь Sb1 – стандартное отклонение коэффициента b1 и сравнивается с модифицированным пороговым значением критерия Дики-Фуллера:

b1/Sb1 < f¥ + f1/n + f2¤/n2,

Здесь n – количество наблюдений во временном ряду;

f¥, f1, f2 – коэффициенты, величина которых зависит от уровня значимости, проверяемой гипотезы, а также от того, учитывает ли уравнение наличие в нем положительной средней и тренда (таб. 5.4). Значения коэффициентов приведены в таблице. При выполнении неравенства исследуемый временной ряд признается стационарным рядом, в противном случае имеем интегрированный ряд первого порядка.

Таблица 5.4.

Значения коэффициентов f.

Коэффи-
циент
Без учета средней и тренда С учетом средней С учетом средней и тренда
1% 5% 1% 5% 1% 5%
f¥ -2,57 -1,94 -3,43 -2,86 -3,96 -3,41
f1 -1,96 -0,398 -6,0 -2,74 -8,35 -4,04
f2 -10,04 -29,25 -8,36 -47,44 -17,83

Для оценки параметров моделей в современных статистических пакетах используются разные методы: МНК, нелинейный МНК, метод максимального правдоподобия.

Если в результате проверки несколько моделей оказываются адекватными исходным данным, то для окончательного выбора возможно использование информационных критериев Акаики и Шварца. В данных критериях при окончательном выборе модели учитывается два требования: повышение точности модели и уменьшение числа параметров модели. Критерий Акаике (Akaika information criterion, AIC) рассчитывается по формуле:

,

где - уровни ряда остатки.

В критерии Шварца (Schwarz criterion, SIK) усиливается требование уменьшения количества параметров модели:

Согласно этим критериям, следует выбрать модель с меньшим значением AIC и SIK.

Прогнозирование по АRIМА моделям. Предположим, что в момент t необходимо сделать прогноз величины , τ≥1. Прогнозное значение определим непосредственно по разностному уравнению

последовательно полагая i=1,2,…τ и заменяя для t их прогнозами, полученными на предыдущих шагах.

Модель авторегрессии можно применять для отображения сезонных колебаний, для этого необходимо учитывать 12 предшествующих уровней для месячных данных или 4 предшествующих уровня для квартальных данных. В большинстве случаев модель оказывается перегруженной незначимыми коэффициентами и является неустойчивой. Для построения такой модели необходимо иметь длинные временные ряды, что не всегда представляется возможным. В основном модель авторегрессии применяют для описания процессов, имеющих небольшой период колебаний.

Контрольные вопросы и задания

1. В чем состоит отличительная особенность адаптивных моделей прогнозирования от моделей кривых роста?

2. Что характеризует параметр адаптации в адаптивных моделях?

3. Дайте определение адаптивным методам экономического прогнозирования.

4. Перечислите основные этапы построения адаптивных моделей прогнозирования.

5. Объясните влияние параметра адаптации α на характер временного ряда, полученного после процедуры экспоненциального сглаживания.

6. Перечислите основные типы адаптивных моделей.

7. Какие адаптивные модели используются для моделирования тренд-сезонного временного ряда?

8. Как можно определить начальные оценки параметров в моделях Хольта-Уинтерса аддитивного и мультипликативного типов?

9. В таблице приведены данные о кредитах, выданных банком, млн.руб.

Период
кредит, млн. руб.

Построить аддитивную модель Брауна с параметром сглаживания α=0,2 и α=0,6 и дать прогноз на два шага вперед.

10. По данным задания 9 построить аддитивную модель Хольта. В качестве начальных оценок параметров взять МНК-оценки линейного тренда. Принять параметры сглаживания . Дать прогноз на два шага вперед.

11. Дайте определение стационарному процессу в строгом смысле.

12. Перечислите основные свойства стационарного процесса в широком смысле.

13. Какой процесс называется белым шумом?

14. Какой процесс называется гауссовским белый шумом?

15. Что понимается под эргодичностью и как используется это свойство в анализе временных рядов?

16. Какое свойство временных рядов используется при построении авторегрессионных моделей?

17. Дайте определение авторегрессионному процессу порядка р.

18. Что означает «интегрирование» при анализе временных рядов?

19. Какой временной ряд называется интегрированным рядом второго порядка?

20. Какое условие необходимо и достаточно для стационарности процесса?

21. Что такое марковский процесс, перечислите основные свойства марковского процесса.

22. Какой процесс называется процессом случайного блуждания?

23. Дайте определение процессу Юла?

24. Каким условиям должны удовлетворять первых два коэффициента автокорреляции в процессе Юла?

25. Каким образом оцениваются параметры авторегрессионной модели?

26. Какое свойство временных рядов используется при построении модели скользящей средней?

27. Дайте определение процессу скользящего среднего порядка q.

28. Перечислите основные свойства процесса скользящего среднего порядка q.

29. Какая существует связь между стационарным АR-процессом и МА-процессом?

30. Охарактеризуйте поведение автокорреляционной и частной автокорреляционной функций для процесса АRМА(p,q).

31. Для описания каких временных рядов используется модель Бокса-Дженкинса?

32. Перечислите основные этапы построения модели Бокса-Дженкинса.

33. Какие критерии используют для проверки значимости коэффициентов автокорреляции?

34. Для каких целей используется тест Дики-Фуллера?

35. В таблице приведены данные после выделения неслучайной составляющей.

-23 -23 -17
-6 -4 -6 -1

Найти автокорреляционые функции исходного ряда, его первых и вторых разностей. Какие авторегрессионные модели для данного ряда можно предложить. Обоснуйте свое мнение.

Глава 6. Оценка точности и адекватности модели

После построения математической модели временного ряда ставится вопрос о возможности ее применения для анализа и прогнозирования изучаемого явления. Ответ на этот вопрос может быть получен после проверки расчетной модели на адекватность реальному процессу. Полного соответствия математической модели реальному процессу быть не может, поэтому проверяется не адекватность вообще, а адекватность тех свойств, которые являются существенными для исследователя, а именно правильность отражения моделью систематических компонент временного ряда. Систематические компоненты включает в себя тренд и периодические колебания. При правильном отображении этих компонент изменение остаточной компоненты не будет связано с изменением времени, т.е. будет носить случайный характер.

Поэтому принято считать, что модель адекватна изучаемому процессу, если остаточная компонента представляет собой случайную компоненту временного ряда. Это требование будет выполняться, если остаточная компонента удовлетворяет свойствам:

1) случайности колебаний уровней остаточной последовательности;

2) соответствию распределения остаточной компоненты нормальному закону распределения;

3) равенству математического ожидания остаточной компоненты нулю;

4) независимости значений уровней остаточной компоненты между собой.

Рассмотрим проверку перечисленных свойств подробнее.

Проверка случайности колебаний уровней остаточной последовательности.Проверку случайности колебаний уровней остаточной компоненты проводят используя критерии серий, основанный на медиане (рассмотрен в параграфе 2.3) или критерий поворотных точек (критерий пиков).

Критерий поворотных точек (критерий пиков).

Точка считается поворотной, если она одновременно больше или меньше двух рядом стоящих точек, т.е. < >или ><. Наиболее просто определить поворотные точки, если ряд остатков изобразить графически. Начальное значение также как и последнее значение нельзя считать поворотной точкой. На рисунке 6.1 представлен ряд остатков, хорошо видно, что в ряду число поворотных точек равно 10.

Рис. 6.1. Ряд остатков.

Если остатки случайны, то поворотная точка приходится примерно на каждые 1,5 наблюдения. Если точек больше, то ряд является быстро колеблющимся и это не может быть объяснено только случайностью. Если же их меньше, то последовательные значения положительно коррелированны. Общее число поворотных точек для ряда остатков обозначим через р.

В случайной выборке математическое ожидание числа точек поворота р и дисперсия выражается формулами:

Ряд является случайным с 5% уровнем значимости, если выполняется неравенство:

,

где квадратные скобки означают целую часть числа.

Если это неравенство не выполняется, то ряд остатков нельзя считать случайным, т.е. он содержит регулярную компоненту, мо­дель не является неадекватной.

Соответствие распределения остаточной компоненты нормальному закону распределения. Анализ соответствия ряда остатков нормальному закону распределения осуществляется по RS – критерию:

,

где - соответственно максимальное и минимальное значение остаточной компоненты,

- среднеквадратическое отклонение ряда остатков.

Расчетное значение RS – критерия сравнивается с табличными значениями RS – критерия (таб. 6.1) . Если расчетное попадает в интервал, ограниченный табличными значениями данного критерия, то с заданным уровнем значимости гипотеза о нормальности распределения остаточной компоненты принимается. В противном случая модель считается неадекватной.

Таблица 6.1

Критические границы RS – критерия

Число наблюдений α=0,05 α=0,10
Нижняя граница Верхняя граница Нижняя граница Верхняя граница
2,50
2,67
2,80
2,92
3,01
3,10
3,18
3,34
3,47
3,58
3,67
3,75
3,83
3,399
3,685
3,91
4,09
4,24
4,37
4,49
4,71
4,89
5,04
5,16
5,26
5,35
2,59
2,76
2,90
3,02
3,12
3,21
3,29
3,45
3,59
3,70
3,79
3,88
3,95
3,308
3,57
3,78
3,95
4,09
4,21
4,32
4,53
4,70
4,84
4,96
5,06
5,14

Проверка соответствия распределения остаточной компоненты нормальному закону распределения может быть произведена с помощью исследования показателей асимметрии и эксцесса. Значения коэффициентов асимметрии и эксцесса для нормально распределенной совокупности равны нулю. Так как предполагают, что значения остаточной компоненты являются выборкой из некоторой генеральной совокупности, то можно определить выборочные характеристики асимметрии, эксцесса и их ошибки по формулам:

где А – выборочная характеристика асимметрии; Э – выборочная характеристика эксцесса; и – соответствующие среднеквадратические ошибки.

Если одновременно выполняются следующие неравенства:

то гипотеза о нормальном характере распределения остаточной компоненты принимается.

Если выполняется хотя бы одно из неравенств

то гипотеза о нормальном характере распределения отвергается, модель признается неадекватной.

Другие случаи требуют дополнительной проверки с помощью более сложных критериев.




Ответить

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Вы можете использовать HTML- теги и атрибуты:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

32 + = 38