Глава 4. Доверительные интервалы прогноза. Оценка адекватности и точности моделей
§ 4.1. Доверительные интервалы прогноза
Заключительным этапом применения кривых роста является экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t, соответствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени определяется только одно значение прогнозируемого показателя.
На практике в дополнении к точечному прогнозу желательно определить границы возможного изменения прогнозируемого показателя, задать «вилку» возможных значений прогнозируемого показателя, т.е. вычислить прогноз интервальный.
Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста, может быть вызвано:
1) субъективной ошибочностью выбора вида кривой;
2) погрешностью оценивания параметров кривых;
3) погрешностью, связанной с отклонением отдельных наблюдений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.
Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал, учитывающий неопределенность, связанную с положением тренда, и возможность отклонения от этого тренда, определяется в виде:
(4.1.),
где n — длина временного ряда;
L -период упреждения;
-точечный прогноз на момент n+L;
— значение t-статистики Стьюдента;
— средняя квадратическая ошибка прогноза.
Предположим, что тренд характеризуется прямой:
Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содержат погрешность. Погрешность параметра приводит к вертикальному сдвигу прямой, погрешность параметра
— к изменению угла наклона прямой относительно оси абсцисс. С учетом разброса конкретных реализаций относительно линий тренда, дисперсию
можно представить в виде:
(4.2.),
где — дисперсия отклонений фактических наблюдений от расчетных;
— время упреждения, для которого делается экстраполяция;
= n + L ;
t- порядковый номер уровней ряда, t=1,2, . , n;
— порядковый номер уровня, стоящего в середине ряда,
=(n+1):2
Тогда доверительный интервал можно представить в виде:
(4.3.)
Обозначим корень в выражении (4.3.) через К. Значение К зависит только от n и L, т.е. от длины ряда и периода упреждения. Поэтому можно составить таблицы значений К или К*= t a K . Тогда интервальная оценка будет иметь вид:
(4.4.)
Выражение, аналогичное (4.3.), можно получить для полинома второго порядка:
(4.5.)
(4.6.)
Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:
(4.7.),
где — фактические значения уровней ряда,
— расчетные значения уровней ряда,
n- длина временного ряда,
k — число оцениваемых параметров выравнивающей кривой.
Таким образом, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома.
Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения
Рисунок 4.1. Доверительные интервалы прогноза для линейного тренда
Доверительные интервалы прогнозов, полученных с использованием уравнения экспоненты, определяют аналогичным образом. Отличие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.
По такой же схеме могут быть определены доверительные интервалы для ряда кривых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты).
В таблице 4.1. приведены значения K* в зависимости от длины временного ряда n и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (n) значения K* уменьшаются, с ростом периода упреждения L значения K* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений n: чем больше длина ряда, тем меньшее влияние оказывает период упреждения L.
Значения К * для оценки доверительных интервалов прогноза на основе линейного тренда и параболического тренда при доверительной вероятности 0,9 (7).
Период упреждения (L)
период упреждения (L)
2,6380 2,8748 3,1399
2,4631 2,6391 2,8361
2,3422 2,4786 2,6310
2,2524 2,3614 2,4827
2,1827 2,2718 2,3706
2,1274 2,2017 2,2836
2,0837 2,1463 2,2155
2,0462 2,1000 2,1590
2,0153 2,0621 2,1131
1,9883 2,0292 2,0735
1,9654 2,0015 2,0406
1,9455 1,9776 2,0124
1,9280 1,9568 1,9877
1,9117 1,9375 1,9654
1,8975 1,9210 1,9461
1,8854 1,9066 1,9294
1,8738 1,8932 1,9140
1,8631 1,8808 1,8998
1,8538 1,8701 1,8876
§ 4.2. Проверка адекватности выбранных моделей
Проверка адекватности выбранных моделей реальному процессу (в частности, адекватности полученной кривой роста) строится на анализе случайной компоненты. Случайная остаточная компонента получается после выделения из исследуемого ряда систематической составляющей (тренда и периодической составляющей, если она присутствует во временном ряду). Предположим, что исходный временной ряд описывает процесс, не подверженный сезонным колебаниям, т.е. примем гипотезу об аддитивной модели ряда вида:
(4.8.)
Тогда ряд остатков будет получен как отклонения фактических уровней временного ряда ( ) от выравненных, расчетных (
):
(4.9.)
При использовании кривых роста вычисляют, подставляя в уравнения выбранных кривых соответствующие последовательные значения времени.
Принято считать, что модель адекватна описываемому процессу, если значения остаточной компоненты удовлетворяют свойствам случайности, независимости, а также случайная компонента подчиняется нормальному закону распределения.
При правильном выборе вида тренда отклонения от него будут носить случайный характер. Это означает, что изменение остаточной случайной величины не связано с изменением времени. Таким образом, по выборке, полученной для всех моментов времени на изучаемом интервале, проверяется гипотеза о зависимости последовательности значений от времени, или, что то же самое, о наличии тенденции в ее изменении. Поэтому для проверки данного свойства может быть использован один из критериев, рассматриваемых в разделе I, например, критерий серий.
Если вид функции, описывающей систематическую составляющую, выбран неудачно, то последовательные значения ряда остатков могут не обладать свойствами независимости, т.к. они могут коррелировать между собой. В этом случае говорят, что имеет место автокорреляция ошибок.
В условиях автокорреляции оценки параметров модели, полученные по методу наименьших квадратов, будут обладать свойствами несмещенности и состоятельности (с этими свойствами знакомятся в курсе математической статистики). В то же время эффективность этих оценок будет снижаться, а, следовательно, доверительные интервалы будут иметь мало смысла в силу своей ненадежности.
Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является метод, предложенный Д арби ным и Уотсоном. Критерий Д арби на-Уотсона связан с гипотезой о существовании автокорреляции первого порядка, т.е. автокорреляции между соседними остаточными членами ряда. Значение этого критерия определяется по формуле:
(4.10.)
Можно показать, что величина d приближенно равна:
d » 2(1-) (4.11),
где — коэффициент автокорреляции первого порядка (т.е. парный коэффициент корреляции между двумя рядами
и
).
Из последней формулы видно, что если в значениях имеется сильная положительная автокорреляция (
» 1), то величина d=0 , в случае сильной отрицательной автокорреляции (
» -1) d=4. При отсутствии автокорреляции (
» 0) d=2.
Для этого критерия найдены критические границы, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции. Авторами критерия границы определены для 1, 2,5 и 5% уровней значимости . Значения критерия Д арби на-Уотсона при 5% уровне значимости приведены в таблице 4.2. В этой таблице и
— соответственно нижняя и верхняя доверительные границы критерия Д арби на-Уотсона;
— число переменных в модели; n — длина временного ряда.
Значения критерия Д арби на-Уотсона d1 и d2 при 5% уровне значимости
Источник